音頻檔案格式

維基百科,自由的百科全書
(重定向自音频编码
跳到: 導覽搜尋

音訊檔案格式專指存放音訊數據的檔案的格式。存在多種不同的格式。

一般獲取音訊數據的方法是:採用固定的時間間隔,對音訊電壓採樣(量化),並將結果以某種解像度(例如:CDDA每個採樣為16位元或2位元組)儲存。採樣的時間間隔可以有不同的標準,如CDDA採用每秒44100次;DVD採用每秒48000或96000次。因此,取樣率解像度聲道數目(例如立體聲為2聲道)是音訊檔案格式的關鍵參數。

需要分清楚的是音訊檔案和編解碼器不同。儘管一種音訊檔案格式可以支援多種編碼,例如AVI檔案格式,但多數的音訊檔案僅支援一種音訊編碼。

有兩類主要的音訊檔案格式:

失真檔案格式是基於聲學心理學的模型,除去人類很難或根本聽不到的聲音,例如:一個音量很高的聲音後面緊跟着一個音量很低的聲音。MP3就屬於這一類檔案。

無失真的音訊格式(例如TTA)壓縮比大約是2:1,解壓時不會產生數據/質素上的損失,解壓產生的數據與未壓縮的數據完全相同。如需要保證音樂的原始質素,應當選擇無失真音訊編解碼器。例如,用免費的TTA無失真音訊編解碼器你可以在一張DVD-R碟上儲存相當於20張CD的音樂。

失真壓縮應用很多,但在專業領域使用不多。失真壓縮具有很大的壓縮比,提供相對不錯的聲音質素。

歷史[編輯]

音訊CD格式是1980年由飛利浦公司索尼公司開發的,1982年公布,此後很少改動。這種格式定義一首歌存放在一個CDDA檔案中,輸入取樣率為44100次/秒(即44.1kHz),每個採樣用16位元數據儲存。立體聲數據為1.4M位元/秒。

作為比較,MP3格式壓縮比可以為1:12(同樣是44.1k赫茲取樣率,MP3: 112k位元/秒,CDDA:1.4 M位元/秒)。MP3格式開發始於1987年在德國Fraunhofer IIS,歷時4年,其間經歷了演算法的改進和音質提高。但是由於硬碟的價格較高,這項技術當時應用很少。

1996年,Winamp1.0版的發行成為MP3格式流行的催化劑。Fraunhofer開始向採用他們的演算法的公司索要許可證費用,因此其他替代的免費演算法開始被研發。LAME發行於1998年,並於此後成為主要的MP3編碼器。最近以來,其它的MP3格式的挑戰者包括Windows Media Audio (微軟公司定義的格式)、Ogg Vorbis(一個沒有申請專利自由編解碼器)和高階音訊編碼或者叫AAC(用於蘋果公司的iTunes)。

非壓縮的數據格式[編輯]

目前存在多種非壓縮數據格式,最流行的是WAV格式。WAV檔案的格式靈活,可以儲存多種類別的音訊數據。對於保存原始的錄音數據是一個好的選擇。WAV格式是基於RIFF檔案格式,RIFF格式與AIFFIFF格式類似。

BWF(廣播聲波格式)作為WAV的後繼者,是由歐洲廣播聯盟建立的一種標準音訊格式。BWF檔案中可以存放後設資料。BWF檔案也是也是基於RIFF檔案格式的,副檔名是WAV。有關其訊息參見:歐洲廣播聯盟:Specification of the Broadcast Wave Format - A format for audio data files in broadcasting(廣播聲波格式描述-一種廣播用音訊檔案格式)。歐洲廣播聯盟技術文件3285, 七月1997年。

無損壓縮的數據格式[編輯]

  • APE 龐大的WAV音訊檔案可以透過Monkey's Audio這個軟件進行壓縮為APE格式。被壓縮後的APE檔案容量要比WAV原始檔小一半多。[來源請求]透過Monkey's Audio解壓縮還原以後得到的WAV檔案可以做到與壓縮前的原始檔完全一致。
  • FLAC 格式的源碼完全開放,而且相容幾乎所有的作業系統平台。它的編碼演算法已經透過了嚴格的測試,而且在檔案點損壞的情況下依然能夠正常播放。該格式不僅有成熟的Windows製作程式,還得到了眾多第三方軟件的支援。此外該格式是唯一的已經得到硬件支援的無失真格式[來源請求],Rio公司的硬碟隨身聽Karma,建伍的車載音響MusicKeg以及PhatBox公司的數碼播放機都能支援FLAC格式。
  • TTA
  • WavPack
  • Tak 類似於FLAC和APE,壓縮率類似APE而且解壓縮速度類似FLAC,算是綜合了兩者的優點。此格式的編碼器壓縮的音訊是VBR,即可變位元速率的。

多聲道格式[編輯]

從九十年代起,影院開始將音響系統升級為環繞聲系統,它可容納2個以上的聲道。環繞聲系統中最流行的是微軟公司開發的Windows Media 音訊(或稱WMA)中的「Windows Media Audio Professional(Windows Media 音訊 專業版)」和蘋果公司的iTunes所採用的高階音訊編碼系統(或稱AAC)和杜比數碼系統(或稱AC-3)。這三種編解碼器都是受版權保護的,其編碼器和解碼器須支付許可證費用才能獲得。最流行的多通道格式叫做5.1,意思是5個環繞聲道(左前、前中、右前、左後和右後)和一個低重音聲道(因為人的耳朵無法區分低頻率聲音傳來的方向)。

參考文獻[編輯]

外部連結[編輯]

參見[編輯]