Talk:UTF-8

维基百科,自由的百科全书
跳转至: 导航搜索
电脑和信息技术专题 (获评中重要度)
LampFlowchart.svg 本條目属于电脑和信息技术专题范畴,该专题旨在改善中文维基百科資訊科技相关条目类内容。如果您有意参与,请浏览专题主页、参与讨论,并完成相应的开放性任务。
 未知级未评  根据质量评级标准,本條目尚未接受评级
   根据重要度评级标准,本條目已评为中重要度

RFC 3629 规定的编码规则已经发生一些变化[编辑]

  UTF8-octets = *( UTF8-char )
  UTF8-char   = UTF8-1 / UTF8-2 / UTF8-3 / UTF8-4
  UTF8-1      = %x00-7F
  UTF8-2      = %xC2-DF UTF8-tail
  UTF8-3      = %xE0 %xA0-BF UTF8-tail / %xE1-EC 2( UTF8-tail ) /
                %xED %x80-9F UTF8-tail / %xEE-EF 2( UTF8-tail )
  UTF8-4      = %xF0 %x90-BF 2( UTF8-tail ) / %xF1-F3 3( UTF8-tail ) /
                %xF4 %x80-8F 2( UTF8-tail )
  UTF8-tail   = %x80-BF

已经不见 5,6 bytes 的编码方式了,而且 0xC0,0xC1 以及 F5-FD 位保留

UTF-8 與 unicode 碼的轉換程式[编辑]

(我將之前 CRLin 貼上的整段 javascript 刪除了,如果要刊登自己的程式,其實大可以上傳到某個地方再貼上連結。) AbelCheung 07:55 2006年9月5日 (UTC)


只支援 4 位元組!?[编辑]

「為了和UTF-16的編碼空間一致,在最新的ISO 10646的標準裡,最多只使用4位元組編碼。5位元組及6位元組UTF-8已不會再使用。」 我完全無法理解這句說話,這是指如果要顯示 BMP 以外的字就不能用 UTF-8 嗎?別嚇我,這是甚麼鬼地方得出來的? AbelCheung 06:33 2006年8月6日 (UTC)


需要重寫[编辑]

現在的內容情況是:

  • 使用原因根本不是使用原因
  • 批評是拿一個原因重複列出幾次
  • 不少的錯誤內容,甚麼 4 字節、要和 UTF-16 兼容等等
  • 比起英文版,中文版等於甚麼實質知識都沒有的空泛之談
  • 現在的使用情況 (哪個 OS 用、哪處地方會用到等等) 完全沒有

似乎拿英文版來翻譯為妙。 AbelCheung 08:02 2006年9月5日 (UTC)

著手重寫[编辑]

我對這題目十分感興趣,將會依據英文版來重寫這題目(UTF-8)的內容。

Yufung0903 07:22 2007年4月9日 (UTC)

霍夫曼編碼?[编辑]

有一段“雖然至少有兩類在技術上是受以前的 UTF-8規範所支援,但這些編碼上還沒有被賦予字元,所以不會在實際的文本中出現。 演算法設計與霍夫曼編碼類似。”,但在英文版中並沒有這樣的文句,二來,他是可變長度編碼,但未非霍夫曼編碼吧。 Zao (留言) 2008年7月19日 (六) 07:58 (UTC)

UTF-8对于非法编码是如何处理的[编辑]

请问有没有人知道这方面的材料,或者能在词条里完善这方面的知识?

外部链接已修改[编辑]

各位维基人:

我刚刚修改了UTF-8中的2个外部链接,请大家仔细检查我的编辑。如果您有疑问,或者需要让机器人忽略某个链接甚至整个页面,请访问这个简单的FAQ获取更多信息。我进行了以下修改:

有关机器人修正错误的详情请参阅FAQ。

祝编安。—InternetArchiveBot (報告軟件缺陷) 2017年8月1日 (二) 12:41 (UTC)

外部链接已修改[编辑]

各位维基人:

我刚刚修改了UTF-8中的2个外部链接,请大家仔细检查我的编辑。如果您有疑问,或者需要让机器人忽略某个链接甚至整个页面,请访问这个简单的FAQ获取更多信息。我进行了以下修改:

有关机器人修正错误的详情请参阅FAQ。

祝编安。—InternetArchiveBot (報告軟件缺陷) 2017年9月6日 (三) 12:15 (UTC)