本页使用了标题或全文手工转换

Opus (音訊)

维基百科,自由的百科全书
(重定向自Opus codec
跳转至: 导航搜索
Opus
Opus logo2.svg
扩展名 .opus, .ogg, .webm, .mka
互联网媒体类型 audio/ogg,[1] audio/opus[2]
开发者 IETF 編解碼器工作組
初始版本 2012年9月11日 (2012-09-11)
格式类型 音频
專門由 Ogg, Matroska, WebM
延伸自 SILK, CELT
标准 IETF RFC 6716
自由格式
网站 opus-codec.org
libopus
開發者 Xiph.Org基金會
初始版本 2012年8月26日 (2012-08-26)
穩定版本 1.2(2017年6月20日,​3個月前​(2017-06-20
编程语言 C89
系統平台 跨平台
类型 聲音編碼,參考實做
许可协议 3-clause BSD 許可證
網站 Opus codec downloads

Opus是一個有損聲音編碼的格式,由Xiph.Org基金會開發,之後由網際網路工程任務組(IETF)進行標準化,目標用希望用單一格式包含聲音和語音,取代SpeexVorbis,且適用於網路上低延遲的即時聲音傳輸,標準格式定義於RFC 6716文件。Opus格式是一個開放格式,使用上沒有任何專利或限制。

Opus整合了兩種聲音編碼的技術:以語音編碼為導向的SILK和低延遲的CELT。Opus可以无缝调节高低比特率。在编码器内部它在较低比特率时使用线性预测编码在高比特率时候使用变换编码(在高低比特率交界处也使用两者结合的编码方式)。Opus具有非常低的演算法延遲(預設為22.5 ms),非常適合用於低延遲語音通話的編碼,像是網路上的即時聲音串流、即時同步聲音旁白等等,此外Opus也可以透過降低編碼位元率,達成更低的演算法延遲,最低可以到5 ms。在多個聽覺盲測中,Opus都比MP3AACHE-AAC等常見格式,有更低的延遲和更好的聲音壓縮率。

技术特性[编辑]

比較不同聲音編碼格式的位元率、採樣率與延遲性。
  1. 6 kb/秒到510 kb/秒的比特率;單一頻道最高256 kb/秒
  2. 采样率从8 kHz(窄带)到48 kHz(全频)
  3. 帧大小从2.5毫秒到60毫秒
  4. 支持恒定比特率(CBR)、受約束比特率(CVBR)和可变比特率(VBR)
  5. 支持语音(SILK層)和音乐(CELT層)的單獨或混合模式
  6. 支持单声道和立体声;支持多达255个音軌(多数据流的帧)
  7. 可动态调节比特率,音频带宽和帧大小
  8. 良好的鲁棒性丢失率和数据包丢失隐藏(PLC)
  9. 浮点和定点实现

開發歷史[编辑]

Opus被提出用於在IETF上標準化新的音頻格式,最終被IETF編解碼器工作組接受和授予。它基於Xiph.Org基金會和Skype技術公司兩項最初分開的標準提案。其主要開發人員包括Jean-Marc Valin(Xiph.Org,Octasic,Mozilla Corporation),Koen Vos(Skype)和Timothy B. Terriberry(Xiph.Org,Mozilla Corporation)。其中包括Juin-Hwey(Raymond)Chen(Broadcom),Gregory Maxwell(Xiph.Org,Wikimedia)和Christopher Montgomery(Xiph.Org)也參與其中。

CELT的發展部分格式可以追溯到Vorbis的繼任者的工作名稱Ghost下。作為Xiph.Org基金會的新一代語音編解碼器,Opus取代了Xiph的較早的語音編解碼器Speex,該版本是Jean-Marc Valin先前的一個項目。CELT自2007年11月起開始工作。

SILK部分自2007年1月起一直在Skype開發,作為其SVOPC的繼任者,該公司是一個內部項目,使公司獨立於iSAC和iLBC等第三方編解碼器和相應的許可證付款。

2009年3月,Skype建議在IETF內開發和規范寬帶音頻格式。近一年來,成立了一個適當的工作組,進行了大量辯論。[3]參與專利保護競爭格式標準化的幾家公司的代表表示反對開始免版稅格式的標準化過程:Polycom和愛立信的代表(G.719的創始人和許可人)以及法國Télécom,華為和橙色實驗室(法國Télécom部門),參與創建G.718。

2010年7月,提出了一種混合格式的原型,將兩種提出格式的候選者SILK和CELT相結合。2010年9月,Opus作為標準化提案提交給IETF。在短時間內,格式在2010年10月獲得現有名稱之前,以Harmony的名義出現。[4]2011年2月初,比特流格式暫時凍結,但有待最後更改。[5]2011年7月底,Jean-Marc Valin被Mozilla公司僱用,繼續從事Opus。[20] 2011年11月,工作組最近發出了關於比特流格式的更改的通知。比特流自2012年1月8日以來已被凍結。[6]2012年7月2日,Opus被IETF批准用於標準化。[7]參考軟件中輸入8月8日發布的候選狀態[8]最後的規範發布的RFC 6716於2012年9月10日,[9][10]和版本為1.0和1.0.1 參考實現被釋放一天之後。

2013年7月11日,Opus 1.0.3帶來了錯誤修復和一個新的Surround聲音API,可以提高音軌分配和質量,特別是低頻音軌(LFE)。[11]

2013年12月5日,Opus 1.1發布,整體速度提升和顯著的編碼器質量改進:調諧估計提高了以前有問題的樣本的比特率和質量(如大鍵)、自動語音/音樂檢測提高了混合音頻的質量、中端立體聲降低了許多歌曲的比特率需求、提高瞬態帶寬精度、以及DC抑制低於3 Hz。增加了兩種新的VBR模式:不受限制的更一致的質量以及時間VBR,可以提升響亮的畫面,並通常提高畫質。

Opus 1.1.1於2015年11月26日發布,並於2016年1月12日發布了1.1.2,同時增加了速度優化和錯誤修復。2016年7月15日發布版本1.1.3,並包含錯誤修復、優化、文檔更新和實驗性的Ambisonics工作。

2017年6月26日,Opus 1.2.1版本发布,精简了音频文件体积,改善了音频质量,增强了部分情况下的安全性,编解码器效率提升。准备推动RFC 6716标准更新,标准未更新之前继续兼容RFC 6716。此版本也带来了面向VR的立体声音频解决方案。

音質和低延遲比較[编辑]

Opus與其他流行音頻格式之間的編碼效率比較

Opus已被證明具有優異的音質,而在更高的比特率下,它的音頻格式比AACHE-AACVorbis更具有競爭力。[12]

在64kbit / s的聽力測試中,與HE-AAC編解碼器相比,Opus顯示出優異的音質,HE-AAC由於使用了專利的頻譜帶複製(SBR)技術,這些編解碼器在以前占主導地位。[13][14]在96 kbit / s的聽力測試中,Opus顯示出比Vorbis略高的音質,與AAC和MP3相比音質明顯更好。[15]

Opus具有非常低的算法延遲,作為低音頻延遲通信鏈路的一部分的必要性,可以在現場活動中允許自然對話,網絡音樂表演或對嘴表演。音頻格式的總算法延遲是無論處理速度和傳輸速度如編碼器和實況音頻流的解碼器必須承擔的延遲的總和,例如將音頻樣本緩衝到塊或幀中,允許窗口重疊和可能允許對噪聲整形在解碼器中先行和任何其他形式的先行的,或用於將MP3編碼器,使用的比特儲存器。[16]

150毫秒以下的單向延遲是大多數VoIP系統的首選目標[17] ,使自然對話與轉向受到延遲的影響很小。音樂家通常會感覺到高達約30毫秒音頻延遲的時間,[18] 大致符合Haas效果的融合時間,儘管將每個用戶自己的樂器的播放延遲與往返延遲相匹配也可以有所幫助。[19]音頻/視頻同步,約45-100毫秒的音頻延遲可能是可以接受的。[20]

Opus允許減少質量或提高比特率以實現更小的算法延遲(最小5.0 ms)。[21]雖然參考實現的默認Opus幀為20.0 ms長,但SILK層需要進一步5.0 ms的前瞻加1.5 ms進行重採樣,默認延遲為26.5 ms。當CELT層處於活動狀態時,默認情況下,為了與SILK層同步,窗口重疊需要2.5 ms的前視,其中添加了4.0 ms的匹配延遲。如果編碼器在特殊限制低延遲模式下實例化,則刪除4.0 ms匹配延遲,並禁用SILK層,允許5.0 ms的最小算法延遲。

標籤[编辑]

由於 Opus 格式使用了 Ogg 容器,所以繼承了Vorbis注释。建議的標籤如下(大小寫無關,多用大寫):

  • TITLE
  • VERSION
  • ALBUM
  • TRACKNUMBER
  • ARTIST
  • PERFORMER
  • COPYRIGHT
  • LICENSE
  • ORGANIZATION
  • DESCRIPTION
  • GENRE
  • DATE
  • LOCATION
  • CONTACT
  • ISRC

ID3 不同之處在於可以重覆,比如若作者多於一人,可以用 ARTIST="主要作者一", ARTIST="主要作者二" 標記。[22]

參考資料[编辑]

  1. ^ Ogg Encapsulation for the Opus Audio Codec. IETF. 2012-07-16 [2012-09-12]. 
  2. ^ Network Working Group. RTP Payload Format and File Storage Format for Opus Speech and Audio Codec. Opus codec. IETF. July 4, 2011 [October 26, 2011]. 
  3. ^ IETF working towards royalty-free audio codec. H-online.com. 2009-11-13 [2016-04-07]. 
  4. ^ Vos, Koen. Harmony became Opus. codec. IETF. 2010-10-15 [2016-01-03]. 
  5. ^ IETF Opus codec now ready for testing. Hydrogenaudio. [2012-09-12]. 
  6. ^ Valin, Jean-Marc. IETF update, Mozilla. LiveJournal.com. 2011-08-01 [2012-10-05]. (原始内容存档于2011-11-11). 
  7. ^ Opus Codec. Xiph.org Foundation. [2012-09-12]. 
  8. ^ [opus] Release candidates for 1.0.0 and 1.0.1 are available. opus. Xiph.org Foundation [2012-10-05]. 
  9. ^ It's Opus, it rocks and now it's an audio codec standard!. Mozilla Hacks. [2012-09-12]. 
  10. ^ RFC 6716 on Definition of the Opus Audio Codec. announce. IETF [2012-09-12]. 
  11. ^ Monty; Valin, Jean-Marc. Opus update 20131205: 1.1 Release. 
  12. ^ Maxwell, Gregory. 64kbit/sec stereo multiformat listening test — unofficial results page. Xiph.Org Foundation. 2011 [2011-06-19]. 
  13. ^ Next-Gen Low-Latency Open Codec Beats HE-AAC, Slashdot-Meldung vom 14. April 2011.
  14. ^ Valin, Jean-Marc; Vos, Koen; Skoglund, Jan. Hoene, Christian, 编. Summary of Opus listening test results. Internet Engineering Task Force. 2013-05-17 [2015-06-30]. 
  15. ^ Kamedo2. Results of the public multiformat listening test. July 2014. 
  16. ^ Lutzky, Manfred; Schuller, Gerald; Gayer, Marc; Krämer, Ulrich; Wabnik, Stefan. A guideline to audio codec delay (PDF). In AES 116th convention, Berlin, Germany. 2004: 8–11 [21 December 2016]. 
  17. ^ Lironi, F.; Masseroni, C.; Trivisonno, R.; Ball, C. F. Multi RAB-based multimedia services over GERAN mobile networks. Vehicular Technology Conference, VTC-2005-Fall. IEEE 62nd. 2005, 3: 1662–1666 [30 October 2012]. 
  18. ^ Lago, Nelson Posse; Kon, Fabio. The quest for low latency (PDF). In Proceedings of the International Computer Music Conference. November 2004: 33–36 [30 October 2012]. 
  19. ^ Carôt, Alexander. "Low Latency Audio Streaming for Internet-Based Musical Interaction" in Streaming Media Architectures: Techniques and Applications: Recent Advances. IGI Global. 2010: 362–383. ISBN 978-1-61692-833-9. 
  20. ^ YE, NONG, VAN CHEN, and TONI FARLEY. "Qos Requirements Of Multimedia Data On Computer Networks". Proceedings of the Second International Conference on Active Media Technology, Chongqing, PR China, 29–31 May 2003. World Scientific Publishing Company Incorporated. 2003: 183–189. ISBN 978-981-238-343-3. 
  21. ^ Montgomery, Christopher. A quick showcase of the bleeding edge... CELT 0.10.0 @ constant PEAQ value, varying latency. CELT v0.10 (latest prior to Opus integration). xiph.org. [30 October 2012]. 
  22. ^ Ogg Vorbis Documentation. 

外部連結[编辑]