TIMIT

維基百科,自由的百科全書

TIMIT(英語:The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus),是由德州儀器麻省理工學院SRI International合作構建的聲學-音素連續語音語料庫。

TIMIT數據集的語音採樣頻率為16kHz,一共包含6300個句子,由來自美國八個主要方言地區的630個人每人說出給定的10個句子,所有的句子都在音素級別(phone level)上進行了手動分割,標記。70%的說話人是男性;大多數說話者是成年白人。

外部連結[編輯]