跳至內容

區域指示符

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書

區域指示符(英語:regional indicator symbols)是一組用以對ISO 3166-1二位字母代碼標準的二字母國家地區代碼進行編碼的26個Unicode字元。這種編碼允許對於特定地區的符號進行特殊處理。

2010年10月,Unicode 6.0的發布為國家地區旗幟的繪文字表示提供了區域指示符,作為「對每一面旗幟都進行編碼」的替代方案。除了作為拉丁字母顯示外,這些符號的部分組合還可以在一些裝置上彩現成符號對應的國家地區旗幟[1][2]Unicode FAQ頁面存檔備份,存於網際網路檔案館)表明,國家與地區的旗幟不會在Unicode中直接編碼到單獨的碼位上去,而應當以此法編碼。[3]

在Unicode編碼中,這些符號位於U+1F1E6 🇦 REGIONAL INDICATOR SYMBOL LETTER AU+1F1FF 🇿 REGIONAL INDICATOR SYMBOL LETTER Z之間,在第一輔助平面圍繞字母數字補充區段英語Enclosed Alphanumeric Supplement[4]

繪文字旗幟列表

[編輯]

在一些系統中,旗幟的繪文字可能會顯示為二位國家地區代碼。[5]

一組區域指示符稱為一個「繪文字旗幟序列」,雖然其代碼代表的是地區而非旗幟。[6]

在所有的26 × 26 = 676個雙字母組合中只有270個是合法的Unicode地區代碼,包含了通用當地數據儲存庫(CLDR)的以下子集:[6][7][8]

  • CLDR中全部的256個常規的地區代碼序列
  • CLDR中的兩個宏觀區域(macroregion)的代碼序列(EU與UN)
  • CLDR中全部12個已棄用的地區代碼序列(僅作向前相容用)
當前的繪文字旗幟列表
旗幟 代碼 區域[9] 可能的彩現
🇦🇨 AC 亞森欣島
🇦🇩 AD 安道爾
🇦🇪 AE 阿聯
🇦🇫 AF 阿富汗
🇦🇬 AG 安地卡及巴布達
🇦🇮 AI 安圭拉
🇦🇱 AL 阿爾巴尼亞
🇦🇲 AM 亞美尼亞
🇦🇴 AO 安哥拉
🇦🇶 AQ 南極洲
🇦🇷 AR 阿根廷
🇦🇸 AS 美屬薩摩亞
🇦🇹 AT 奧地利
🇦🇺 AU 澳洲
🇦🇼 AW 阿魯巴
🇦🇽 AX 奧蘭
🇦🇿 AZ 亞塞拜然
🇧🇦 BA 波赫
🇧🇧 BB 巴貝多
🇧🇩 BD 孟加拉
🇧🇪 BE 比利時
🇧🇫 BF 布吉納法索
🇧🇬 BG 保加利亞
🇧🇭 BH 巴林
🇧🇮 BI 蒲隆地
🇧🇯 BJ 貝南
🇧🇱 BL 聖巴泰勒米
🇧🇲 BM 百慕達
🇧🇳 BN 汶萊
🇧🇴 BO 玻利維亞
🇧🇶 BQ 荷蘭加勒比區
🇧🇷 BR 巴西
🇧🇸 BS 巴哈馬
🇧🇹 BT 不丹
🇧🇻 BV 布韋島
🇧🇼 BW 波札那
🇧🇾 BY 白俄羅斯
🇧🇿 BZ 貝里斯
🇨🇦 CA 加拿大
🇨🇨 CC 科科斯(基林)群島
🇨🇩 CD 剛果民主共和國
🇨🇫 CF 中非
🇨🇬 CG 剛果共和國
🇨🇭 CH 瑞士
🇨🇮 CI 象牙海岸
🇨🇰 CK 庫克群島
🇨🇱 CL 智利
🇨🇲 CM 喀麥隆
🇨🇳 CN 中國[註 1]
🇨🇴 CO 哥倫比亞
🇨🇵 CP 克利珀頓島
🇨🇶 CQ 薩克
🇨🇷 CR 哥斯大黎加
🇨🇺 CU 古巴
🇨🇻 CV 維德角
🇨🇼 CW 古拉索
🇨🇽 CX 聖誕島
🇨🇾 CY 賽普勒斯
🇨🇿 CZ 捷克
🇩🇪 DE 德國
🇩🇬 DG 迪戈加西亞島
🇩🇯 DJ 吉布地
🇩🇰 DK 丹麥
🇩🇲 DM 多米尼克
🇩🇴 DO 多明尼加
🇩🇿 DZ 阿爾及利亞
🇪🇦 EA 休達梅利利亞
🇪🇨 EC 厄瓜多
🇪🇪 EE 愛沙尼亞
🇪🇬 EG 埃及
🇪🇭 EH 西撒哈拉
🇪🇷 ER 厄利垂亞
🇪🇸 ES 西班牙
🇪🇹 ET 衣索比亞
🇪🇺 EU 歐盟
🇫🇮 FI 芬蘭
🇫🇯 FJ 斐濟
🇫🇰 FK 福克蘭群島
🇫🇲 FM 密克羅尼西亞聯邦
🇫🇴 FO 法羅群島
🇫🇷 FR 法國
🇬🇦 GA 加彭
🇬🇧 GB 英國
🇬🇩 GD 格瑞那達
🇬🇪 GE 喬治亞
🇬🇫 GF 法屬圭亞那
🇬🇬 GG 根西
🇬🇭 GH 加納
🇬🇮 GI 直布羅陀
🇬🇱 GL 格陵蘭
🇬🇲 GM 甘比亞
🇬🇳 GN 幾內亞
🇬🇵 GP 瓜德羅普
🇬🇶 GQ 赤道幾內亞
🇬🇷 GR 希臘
🇬🇸 GS 南喬治亞和南桑威奇群島
🇬🇹 GT 瓜地馬拉
🇬🇺 GU 關島
🇬🇼 GW 幾內亞比索
🇬🇾 GY 蓋亞那
🇭🇰 HK 香港
🇭🇲 HM 赫德島和麥克唐納群島
🇭🇳 HN 宏都拉斯
🇭🇷 HR 克羅埃西亞
🇭🇹 HT 海地
🇭🇺 HU 匈牙利
🇮🇨 IC 加納利群島
🇮🇩 ID 印尼
🇮🇪 IE 愛爾蘭
🇮🇱 IL 以色列
🇮🇲 IM 曼島
🇮🇳 IN 印度
🇮🇴 IO 英屬印度洋領地
🇮🇶 IQ 伊拉克
🇮🇷 IR 伊朗
🇮🇸 IS 冰島
🇮🇹 IT 義大利
🇯🇪 JE 澤西
🇯🇲 JM 牙買加
🇯🇴 JO 約旦
🇯🇵 JP 日本
🇰🇪 KE 肯亞
🇰🇬 KG 吉爾吉斯
🇰🇭 KH 柬埔寨
🇰🇮 KI 吉里巴斯
🇰🇲 KM 葛摩
🇰🇳 KN 聖克里斯多福及尼維斯
🇰🇵 KP 北韓
🇰🇷 KR 南韓
🇰🇼 KW 科威特
🇰🇾 KY 開曼群島
🇰🇿 KZ 哈薩克
🇱🇦 LA 寮國
🇱🇧 LB 黎巴嫩
🇱🇨 LC 聖露西亞
🇱🇮 LI 列支敦斯登
🇱🇰 LK 斯里蘭卡
🇱🇷 LR 賴比瑞亞
🇱🇸 LS 賴索托
🇱🇹 LT 立陶宛
🇱🇺 LU 盧森堡
🇱🇻 LV 拉脫維亞
🇱🇾 LY 利比亞
🇲🇦 MA 摩洛哥
🇲🇨 MC 摩納哥
🇲🇩 MD 摩爾多瓦
🇲🇪 ME 蒙特內哥羅
🇲🇫 MF 法屬聖馬丁
🇲🇬 MG 馬達加斯加
🇲🇭 MH 馬紹爾群島
🇲🇰 MK 北馬其頓
🇲🇱 ML 馬里
🇲🇲 MM 緬甸
🇲🇳 MN 蒙古國
🇲🇴 MO 澳門
🇲🇵 MP 北馬利安納群島
🇲🇶 MQ 馬提尼克
🇲🇷 MR 茅利塔尼亞
🇲🇸 MS 蒙哲臘
🇲🇹 MT 馬爾他
🇲🇺 MU 模里西斯
🇲🇻 MV 馬爾地夫
🇲🇼 MW 馬拉威
🇲🇽 MX 墨西哥
🇲🇾 MY 馬來西亞
🇲🇿 MZ 莫三比克
🇳🇦 NA 納米比亞
🇳🇨 NC 新喀里多尼亞
🇳🇪 NE 尼日
🇳🇫 NF 諾福克島
🇳🇬 NG 奈及利亞
🇳🇮 NI 尼加拉瓜
🇳🇱 NL 荷蘭
🇳🇴 NO 挪威
🇳🇵 NP 尼泊爾
🇳🇷 NR 諾魯
🇳🇺 NU 紐埃
🇳🇿 NZ 紐西蘭
🇴🇲 OM 阿曼
🇵🇦 PA 巴拿馬
🇵🇪 PE 秘魯
🇵🇫 PF 法屬玻里尼西亞
🇵🇬 PG 巴布亞紐幾內亞
🇵🇭 PH 菲律賓
🇵🇰 PK 巴基斯坦
🇵🇱 PL 波蘭
🇵🇲 PM 聖皮耶與密克隆
🇵🇳 PN 皮特肯群島
🇵🇷 PR 波多黎各
🇵🇸 PS 巴勒斯坦
🇵🇹 PT 葡萄牙
🇵🇼 PW 帛琉
🇵🇾 PY 巴拉圭
🇶🇦 QA 卡達
🇷🇪 RE 留尼旺
🇷🇴 RO 羅馬尼亞
🇷🇸 RS 塞爾維亞
🇷🇺 RU 俄羅斯
🇷🇼 RW 盧安達
🇸🇦 SA 沙烏地阿拉伯
🇸🇧 SB 索羅門群島
🇸🇨 SC 塞席爾
🇸🇩 SD 蘇丹
🇸🇪 SE 瑞典
🇸🇬 SG 新加坡
🇸🇭 SH 聖赫勒拿
🇸🇮 SI 斯洛維尼亞
🇸🇯 SJ 斯瓦爾巴和揚馬延
🇸🇰 SK 斯洛伐克
🇸🇱 SL 獅子山
🇸🇲 SM 聖馬利諾
🇸🇳 SN 塞內加爾
🇸🇴 SO 索馬利亞
🇸🇷 SR 蘇利南
🇸🇸 SS 南蘇丹
🇸🇹 ST 聖多美普林西比
🇸🇻 SV 薩爾瓦多
🇸🇽 SX 荷屬聖馬丁
🇸🇾 SY 敘利亞
🇸🇿 SZ 史瓦帝尼
🇹🇦 TA 崔斯坦達庫尼亞
🇹🇨 TC 土克凱可群島
🇹🇩 TD 查德
🇹🇫 TF 法屬南部和南極領地
🇹🇬 TG 多哥
🇹🇭 TH 泰國
🇹🇯 TJ 塔吉克
🇹🇰 TK 托克勞
🇹🇱 TL 東帝汶
🇹🇲 TM 土庫曼
🇹🇳 TN 突尼西亞
🇹🇴 TO 東加
🇹🇷 TR 土耳其
🇹🇹 TT 千里達及托巴哥
🇹🇻 TV 吐瓦魯
🇹🇼 TW 臺灣[註 2]
🇹🇿 TZ 坦尚尼亞
🇺🇦 UA 烏克蘭
🇺🇬 UG 烏干達
🇺🇲 UM 美國本土外小島嶼
🇺🇳 UN 聯合國
🇺🇸 US 美國
🇺🇾 UY 烏拉圭
🇺🇿 UZ 烏茲別克
🇻🇦 VA 梵蒂岡
🇻🇨 VC 聖文森及格瑞那丁
🇻🇪 VE 委內瑞拉
🇻🇬 VG 英屬維京群島
🇻🇮 VI 美屬維京群島
🇻🇳 VN 越南
🇻🇺 VU 萬那杜
🇼🇫 WF 瓦利斯和富圖納
🇼🇸 WS 薩摩亞
🇽🇰 XK 科索沃
🇾🇪 YE 葉門
🇾🇹 YT 馬約特
🇿🇦 ZA 南非
🇿🇲 ZM 尚比亞
🇿🇼 ZW 辛巴威
已棄用的文字序列
已棄用的文字序列 取而代之的文字序列[10][11]
代碼 區域 旗幟 代碼 區域 JoyPixels可能的彩現結果
AN 荷屬安地列斯 🇨🇼 CW 古拉索
🇸🇽 SX 荷屬聖馬丁
🇧🇶 BQ 荷蘭加勒比區
BU 緬甸 🇲🇲 MM 緬甸
CS 塞爾維亞與蒙特內哥羅 🇷🇸 RS 塞爾維亞
🇲🇪 ME 蒙特內哥羅
DD 東德 🇩🇪 DE 德國
FX 法國本土 🇫🇷 FR 法國
NT 沙烏地阿拉伯-伊拉克中立區 🇸🇦 SA 沙烏地阿拉伯
🇮🇶 IQ 伊拉克
QU 歐盟 🇪🇺 EU 歐盟
SU 蘇聯 🇷🇺 RU 俄羅斯
🇦🇲 AM 亞美尼亞
🇦🇿 AZ 亞塞拜然
🇧🇾 BY 白俄羅斯
🇪🇪 EE 愛沙尼亞
🇬🇪 GE 喬治亞
🇰🇿 KZ 哈薩克
🇰🇬 KG 吉爾吉斯
🇱🇻 LV 拉脫維亞
🇱🇹 LT 立陶宛
🇲🇩 MD 摩爾多瓦
🇹🇯 TJ 塔吉克
🇹🇲 TM 土庫曼
🇺🇦 UA 烏克蘭
🇺🇿 UZ 烏茲別克
TP 東帝汶 🇹🇱 TL 東帝汶
YD 南葉門 🇾🇪 YE 葉門
YU 塞爾維亞與蒙特內哥羅 🇷🇸 RS 塞爾維亞
🇲🇪 ME 蒙特內哥羅
ZR 薩伊 🇨🇩 CD 剛果民主共和國

Unicode區段

[編輯]
圍繞字母數字補充區段英語Enclosed Alphanumeric Supplement[1]的區域指示符部分

Unicode聯盟官方碼表頁面存檔備份,存於網際網路檔案館) (PDF)

  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1F1Ex (U+1F100–U+1F1E5 已省略)   🇦     🇧     🇨     🇩     🇪     🇫     🇬     🇭     🇮     🇯  
U+1F1Fx   🇰     🇱     🇲     🇳     🇴     🇵     🇶     🇷     🇸     🇹     🇺     🇻     🇼     🇽     🇾     🇿  
Notes
1.^ 依據Unicode 13.0

背景

[編輯]

在2007年,Unicode收到了一份對於廣泛使用的繪文字編碼提案,這份提案上的繪文字主要出自日本通訊公司NTT DOCOMOKDDI軟銀集團之手。[12]提案中的符號包含了下列十面旗幟[13] 中國(🇨🇳)、 德國(🇩🇪)、 西班牙(🇪🇸)、 法國(🇫🇷)、 英國(🇬🇧)、 義大利(🇮🇹)、 日本(🇯🇵)、 南韓(🇰🇷)、 俄羅斯(🇷🇺)和 美國(🇺🇸)。有觀點認為,僅僅對於這十面旗幟編碼這一做法包含偏見。[14]一個被駁回的編碼提案是,在保留旗幟的情況下,稱它們為「繪文字相容字元-n」(EMOJI COMPATIBILITY SYMBOL-n)並以標準「EC n」顯示,而不展示它們代表的旗幟;[15]另一個被駁回的提案為676種雙字母組合中每一種都分配了碼位,以ISO 3166標準(如FR代表法國)或國家和地區頂級域(如EU代表歐盟)與旗幟對應。[16]

最終被接受的方案添加了與拉丁字母相對應的26個字元以表示區域指示符,當其按照上文的序列出現時會呈現出對應的旗幟,同時為繪文字的擴充預留了空間以供後續添加。[2]根據Unicode標準,「此類[區域指示符的]組合的主要目的是,為表情符號核心集合中使用的特定字元提供明確雙向對映」(the main purpose of such [regional indicator symbol] pairs is to provide unambiguous roundtrip mappings to certain characters used in the emoji core sets[17],此處特指以下十面國旗:[18]🇨🇳、🇩🇪、🇪🇸、🇫🇷、🇬🇧、🇮🇹、🇯🇵、🇰🇷、🇷🇺和🇺🇸。

由於Unicode的區域指示符只提供地區代碼、不提供旗幟,特定的系統可以採取不彩現字元的方式以避免引起非議。如在台灣問題中,對於實際統治台灣地區台北政府北京政府拒絕承認,因此在中國大陸的新聞媒體報道中,中華民國國旗會被作馬賽克處理,而在大陸法律下的電子產品,「🇹🇼」也會顯示為字元缺失或不作為旗幟顯示。[19][20]

參見

[編輯]

註釋

[編輯]

參考文獻

[編輯]
  1. ^ Andrew West. What's new in Unicode 6.0. Babelstone. [2014-08-18]. (原始內容存檔於2014-04-06). 
  2. ^ 2.0 2.1 Michael Everson and Ken Whistler. N3727: Proposal to encode Regional Indicator Symbols in the UCS (PDF). Working Group Document, ISO/IEC JTC1/SC2/WG2 and UTC. [2014-08-18]. (原始內容存檔 (PDF)於2015-07-31). 
  3. ^ Unicode FAQ: Emoji and Dingbats. The Unicode Consortium. 2009-10-28 [2014-08-18]. (原始內容存檔於2014-07-26). 
  4. ^ Enclosed Alphanumeric Supplement, Range 1F100 - 1F1FF, The Unicode Standard, Version 6.0 (PDF). Unicode Consortium. 2010 [2014-08-18]. (原始內容存檔 (PDF)於2015-07-30). 
  5. ^ Flags. emojipedia.com. [2020-02-04]. (原始內容存檔於2020-01-31). 
  6. ^ 6.0 6.1 UTR #51: Unicode Emoji, Annex B: Valid Emoji Flag Sequences, Unicode Consortium web, 2020-02-11 [2020-07-11], (原始內容存檔於2020-06-30) 
  7. ^ UTR #35: Unicode Locale Data Markup Language (LDML), Validity Data. Unicode Consortium. [2020-07-11]. (原始內容存檔於2020-07-14). 
  8. ^ CLDR v37 Region Validity Data. Unicode Common Locale Data Repository (CLDR). 2020-04-23. [失效連結]
  9. ^ UCD: Emoji Sequence Data for UTR #51. Unicode Consortium. 2020-01-28 [2020-07-11]. (原始內容存檔於2024-03-27). 
  10. ^ UTR #35: Unicode Locale Data Markup Language (LDML), Supplemental Metadata. Unicode Consortium. [2020-07-11]. (原始內容存檔於2020-07-11). 
  11. ^ CLDR v37 Supplemental Metadata. Unicode Common Locale Data Repository (CLDR). 2020-04-23. [失效連結]
  12. ^ Momoi, Kat; Davis, Mark; Scherer, Markus. L2/07-257: Working Draft Proposal for Encoding Emoji Symbols. 2007-08-03 [2014-08-18]. (原始內容存檔於2014-07-12). 
  13. ^ Unicode Mapping for Emoji with Reference to Japanese Carriers, AU/KDDI, DoCoMo, and Softbank (ZIP archive file format). [2014-08-18]. (原始內容存檔於2015-07-31). 
  14. ^ L2/09-114 N3607: Towards an encoding of symbol characters used as emoji (PDF). 2009-04-06 [2014-08-18]. (原始內容存檔 (PDF)於2015-07-31). 
  15. ^ INCITS/L2/09-304: Comments accompanying the U.S. negative vote on PDAM 8 to ISO/IEC 10646:2003 (SC2 N4078) (PDF). 2009-08-15 [2014-08-18]. (原始內容存檔 (PDF)於2015-07-31). 
  16. ^ Pentzlin, Karl. L2/08-305: Some suggestions about the encoding of national flags as requested by the Emoji proposal (PDF). 2008-08-09 [2014-08-18]. (原始內容存檔 (PDF)於2015-05-01). 
  17. ^ The Unicode Standard, Version 6.2, Chapter 15: Symbols (PDF). Unicode, Inc. September 2012: 534 [2020-07-11]. ISBN 978-1-936213-07-8. (原始內容存檔 (PDF)於2020-08-09). 
  18. ^ Emoji Sources (plain text). Unicode, Inc. 2013-12-17 [2014-08-18]. (原始內容存檔於2014-08-23). 
  19. ^ 法制網數十家世界500強外企官網錯誤標識我國港澳台地區 專家建議依法處置錯誤標識中國領土行為頁面存檔備份,存於網際網路檔案館
  20. ^ 港澳iOS 13中華民國國旗被「河蟹」消失無蹤 港網民議論 - 科技. 中時新聞網. 2019-10-08 [2023-05-24]. (原始內容存檔於2020-07-11) (中文(臺灣)).