Deflate
Deflate(通常按早期電腦程式設計習慣寫為DEFLATE)是同時使用了LZ77演算法與霍夫曼編碼(Huffman Coding)的一個無失真數據壓縮演算法。它最初是由美國程式設計師菲爾·卡茨(Phil Katz)為他的PKZIP軟件第二版所定義的,後來被RFC 1951標準化[1]。
菲爾·卡茨及其所擁有的PKWARE, Inc為該演算法申請了美國專利5051745號[2]。人們普遍認為DEFLATE不受任何專利所覆蓋,並且在LZW(GIF檔案格式使用)相關的專利失效之前,這種格式除了應用在ZIP檔案格式中,也使用於gzip壓縮檔案以及PNG圖檔中。
DEFLATE壓縮與解壓的原始碼可以在自由、通用的壓縮函式庫zlib上找到。
7-zip實作了更高壓縮比的DEFLATE,AdvanceCOMP也使用這種實作,它可以對gzip、PNG、MNG以及ZIP檔案進行壓縮從而得到比zlib更小的檔案大小。在Ken Silverman的KZIP與PNGOUT中使用了一種更加高效同時要求更多用戶輸入的DEFLATE程式。
串流格式
[編輯]Deflate串流是指位元串流。也即,我們首先把它看作位元組串流,然後對每個位元組,確定其位元順序。對於X86這樣的小端序平台,就是按照位元組內部最不顯著位元(Least Significant Bit) 到最顯著位元(Most Significant Bit)的順序。例如,對於位元組0x15,它的位元序列是10101000。
Deflate串流包含一系列數據塊。每塊以3位元的標頭開始:
- 第1位元: Last-block-in-stream marker:
1
: 串流的最後一塊0
: 不是串流的最後一塊
- 第2、第3位元: 編碼方法
00
: 無壓縮的stored/raw/literal, 長度在0至65,535位元組01
: 靜態霍夫曼壓縮。採用事先定義(因而無須儲存在串流中)的霍夫曼樹10
: 動態霍夫曼樹11
: 保留,未使用
程式設計介面
[編輯]Deflate可以免費在很多程式語言中使用。C語言通常使用zlib函式庫。C++語言可以使用7-Zip/AdvanceCOMP。Java語言套件含在標準函式庫java.util.zip中。Microsoft .NET Framework 2.0包含在System.IO.Compression命名空間中。
- PKZIP: 該演算法最早的實作
- zlib/gzip: 標準參考實作(standard reference implementation),由於其公共可用性,得到了及其廣泛的使用。
- Crypto++: C++開源實作
- 7-Zip/AdvanceCOMP: Igor Pavlov的C++開源自由實作
- PuTTY 『sshzlib.c』: 一份單獨實作
- Plan 9 from Bell Labs 的libflate(頁面存檔備份,存於互聯網檔案館)
- Hyperbac: C++與組合語言實作
- Zopfli: Google的C語言實作
參見
[編輯]參考文獻
[編輯]外部連結
[編輯]- PKWARE, Inc.'s
appnote.txt
, .ZIP File Format Specification(頁面存檔備份,存於互聯網檔案館); Section 10, X. Deflating – Method 8. - RFC 1951 – Deflate Compressed Data Format Specification version 1.3
- zlib Home Page(頁面存檔備份,存於互聯網檔案館)
- An Explanation of the Deflate Algorithm(頁面存檔備份,存於互聯網檔案館) – by Antaeus Feldspar
- Extended Application of Suffix Trees to Data Compression (頁面存檔備份,存於互聯網檔案館) – an excellent algorithm to implement Deflate by Jesper Larsson