本页使用了标题或全文手工转换

Bencode

维基百科,自由的百科全书
跳转至: 导航搜索

Bencode(發音為 Bee-Encode)是 BitTorrent 用在傳輸資料結構的編碼方式。這種編碼方式支援四種資料型態:

Bencode 最常被用在 .torrent 檔中,檔案裡的元數據都是 Bencode 過的字典表

虽然比用纯二进制编码效率低,但由于结构简单而且不受字节存储顺序影响(所有数字以十进制编码)——这对于跨平台性非常重要。而且具有较好的灵活性,即使存在故障的字典键,只要将其忽略并更换新的就能兼容补充。

编码方法[编辑]

Bencode使用ASCII字符作为分隔符和数字。

  • 一个整型数会以十进制数编码并括在i和e之间,不允许前导零(但0依然为整数0),负数在编码后直接加前导负号,不允许负零。如整型数“42”编码为“i42e”,数字“0”编码为“i0e”, “-42”编码为“i-42e”。
  • 一个字节的字符串(只是一个字节的字符串,不一定是一个方块字)会以(长度):(内容)编码,长度的值和数字编码方法一样,只是不允许负数;内容就是字符串的内容,如字符串“spam”就会编码为“4:spam”,本规则不能处理ASCII以外的字符串,为了解决这个问题,一些BitTorrent程序会以非标准的方式将ASCII以外的字符以UTF-8转化后再编码。
  • 线性表会以l和e括住来编码,其中的内容为上面两种类型编码后的编码字串,如包含和字符串“spam”数字“42”的线性表会被编码为“l4:spami42ee”,注意分隔符要对应配对。
  • 字典表会以d和e括住来编码,字典元素的键和值必须紧跟在一起,而且所有键为字符串类型并按字典顺序排好。如键为“bar”值为字串“spam”和鍵为“foo”值为整數“42”的字典表会被编码为“d3:bar4:spam3:fooi42ee”。

对于线性表和字典的取值范围并没有限制,他们通常会包含其他元素,这样就允许对很复杂的数据结构进行编码。

外部連結[编辑]