国际化域名编码

维基百科,自由的百科全书
(重定向自Punycode
跳到导航 跳到搜索

国际化域名编码[1](英語:Punycode)是一种表示Unicode码和ASCII码的有限的字符集。例如中文上海”会被编码为“fhqz97e”。

Punycode的目的是在于国际化域名标签(IDNA)的框架中,使这些(多语言)的域名可以编码为ASCII。编码语法在文档 RFC 3492 中规定。

例子[编辑]

下表展示了不同类型输入的国际化域名编码的例子。[2]

输入 输入的国际化域名编码 对输入的描述
空字符
a a- 仅有ASCII字符,一个小写字母
A A- 仅有ASCII字符,一个大写字母
3 3- 仅有ASCII字符,一个数字
- -- 仅有ASCII字符,一个连字符
-- --- 仅有ASCII字符,两个连字符
London London- 仅有ASCII字符,多于一个,没有连字符
Lloyd-Atkinson Lloyd-Atkinson- 仅有ASCII字符,一个连字符
This has spaces This has spaces- 仅有ASCII字符,包含空格
-> $1.00 <- -> $1.00 <-- 仅有ASCII字符,多种符号混合
а 80a 没有ASCII字符,一个西里尔字母
ü tda 没有ASCII字符,一个拉丁字母补充-1中的字符
α mxa 没有ASCII字符,一个希腊字母
fsq 没有ASCII字符,一个CJK字符
😉 n28h 没有ASCII字符,一个emoji字符
αβγ mxacd 没有ASCII字符,多于一个字符
München Mnchen-3ya 混合字符,包含一个非ASCII字符
Mnchen-3ya Mnchen-3ya- München的两次国际化域名编码
München-Ost Mnchen-Ost-9db 混合字符串,包括一个非ASCII字符和一个连字符
Bahnhof München-Ost Bahnhof Mnchen-Ost-u6b 混合字符串,包括一个空格,一个连字符和一个非ASCII字符
abæcdöef abcdef-qua4k 混合字符串,包括两个非ASCII字符
правда 80aafi6cg 俄语字符,不包括ASCII字符
ยจฆฟคฏข 22cdfh1b8fsa 泰语字符,不包括ASCII字符
도메인 hq1bm8jm9l 韩语字符,不包括ASCII字符
ドメイン名例 eckwd4c7cu47r2wf 日语字符,不包括ASCII字符
MajiでKoiする5秒前 nowrap|MajiKoi5-783gue6qz075azm5e 日语字符,以及ASCII字符
「bücher」 bcher-kva8445foa 混合的非ASCII字符(拉丁字母补充-1及CJK字符)

参考文献[编辑]

  1. ^ 国际化域名 词汇表. ICANN. [2019-01-22]. (原始内容存档于2022-05-16). 
  2. ^ The Punycode in this table was created using the builtin codec "punycode" of the Python programming language version 3.8 (s.encode("punycode")). See talk page.