跳至內容

區域指示符

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書

區域指示符(英語:regional indicator symbols)是一組用以對ISO 3166-1二位字母代碼標準的二字母國家地區代碼進行編碼的26個Unicode字元。這種編碼允許對於特定地區的符號進行特殊處理。

2010年10月,Unicode 6.0的發佈為國家地區旗幟的繪文字表示提供了區域指示符,作為「對每一面旗幟都進行編碼」的替代方案。除了作為拉丁字母顯示外,這些符號的部分組合還可以在一些裝置上渲染成符號對應的國家地區旗幟[1][2]Unicode FAQ頁面存檔備份,存於互聯網檔案館)表明,國家與地區的旗幟不會在Unicode中直接編碼到單獨的碼位上去,而應當以此法編碼。[3]

在Unicode編碼中,這些符號位於U+1F1E6 🇦 REGIONAL INDICATOR SYMBOL LETTER AU+1F1FF 🇿 REGIONAL INDICATOR SYMBOL LETTER Z之間,在第一輔助平面圍繞字母數字補充區段英語Enclosed Alphanumeric Supplement[4]

繪文字旗幟列表

[編輯]

在一些系統中,旗幟的繪文字可能會顯示為二位國家地區代碼。[5]

一組區域指示符稱為一個「繪文字旗幟序列」,雖然其代碼代表的是地區而非旗幟。[6]

在所有的26 × 26 = 676個雙字母組合中只有270個是合法的Unicode地區代碼,包含了通用當地數據儲存庫(CLDR)的以下子集:[6][7][8]

  • CLDR中全部的256個常規的地區代碼序列
  • CLDR中的兩個宏觀區域(macroregion)的代碼序列(EU與UN)
  • CLDR中全部12個已棄用的地區代碼序列(僅作向前相容用)
當前的繪文字旗幟列表
旗幟 代碼 區域[9] 可能的渲染
🇦🇨 AC 阿森松島
🇦🇩 AD 安道爾
🇦🇪 AE 阿聯酋
🇦🇫 AF 阿富汗
🇦🇬 AG 安提瓜和巴布達
🇦🇮 AI 安圭拉
🇦🇱 AL 阿爾巴尼亞
🇦🇲 AM 亞美尼亞
🇦🇴 AO 安哥拉
🇦🇶 AQ 南極洲
🇦🇷 AR 阿根廷
🇦🇸 AS 美屬薩摩亞
🇦🇹 AT 奧地利
🇦🇺 AU 澳洲
🇦🇼 AW 阿魯巴
🇦🇽 AX 奧蘭
🇦🇿 AZ 阿塞拜疆
🇧🇦 BA 波黑
🇧🇧 BB 巴巴多斯
🇧🇩 BD 孟加拉
🇧🇪 BE 比利時
🇧🇫 BF 布基納法索
🇧🇬 BG 保加利亞
🇧🇭 BH 巴林
🇧🇮 BI 布隆迪
🇧🇯 BJ 貝寧
🇧🇱 BL 聖巴泰勒米
🇧🇲 BM 百慕達
🇧🇳 BN 汶萊
🇧🇴 BO 玻利維亞
🇧🇶 BQ 荷蘭加勒比區
🇧🇷 BR 巴西
🇧🇸 BS 巴哈馬
🇧🇹 BT 不丹
🇧🇻 BV 布韋島
🇧🇼 BW 博茨瓦納
🇧🇾 BY 白俄羅斯
🇧🇿 BZ 伯利茲
🇨🇦 CA 加拿大
🇨🇨 CC 科科斯(基林)群島
🇨🇩 CD 剛果民主共和國
🇨🇫 CF 中非
🇨🇬 CG 剛果共和國
🇨🇭 CH 瑞士
🇨🇮 CI 科特迪瓦
🇨🇰 CK 庫克群島
🇨🇱 CL 智利
🇨🇲 CM 喀麥隆
🇨🇳 CN 中國[註 1]
🇨🇴 CO 哥倫比亞
🇨🇵 CP 克利珀頓島
🇨🇶 CQ 薩克
🇨🇷 CR 哥斯達黎加
🇨🇺 CU 古巴
🇨🇻 CV 維德角
🇨🇼 CW 庫拉索
🇨🇽 CX 聖誕島
🇨🇾 CY 塞浦路斯
🇨🇿 CZ 捷克
🇩🇪 DE 德國
🇩🇬 DG 迪戈加西亞島
🇩🇯 DJ 吉布提
🇩🇰 DK 丹麥
🇩🇲 DM 多米尼克
🇩🇴 DO 多米尼加
🇩🇿 DZ 阿爾及利亞
🇪🇦 EA 休達梅利利亞
🇪🇨 EC 厄瓜多爾
🇪🇪 EE 愛沙尼亞
🇪🇬 EG 埃及
🇪🇭 EH 西撒哈拉
🇪🇷 ER 厄立特里亞
🇪🇸 ES 西班牙
🇪🇹 ET 埃塞俄比亞
🇪🇺 EU 歐盟
🇫🇮 FI 芬蘭
🇫🇯 FJ 斐濟
🇫🇰 FK 福克蘭群島
🇫🇲 FM 密克羅尼西亞聯邦
🇫🇴 FO 法羅群島
🇫🇷 FR 法國
🇬🇦 GA 加蓬
🇬🇧 GB 英國
🇬🇩 GD 格林納達
🇬🇪 GE 格魯吉亞
🇬🇫 GF 法屬圭亞那
🇬🇬 GG 根西
🇬🇭 GH 加納
🇬🇮 GI 直布羅陀
🇬🇱 GL 格陵蘭
🇬🇲 GM 岡比亞
🇬🇳 GN 畿內亞
🇬🇵 GP 瓜德羅普
🇬🇶 GQ 赤道畿內亞
🇬🇷 GR 希臘
🇬🇸 GS 南喬治亞和南桑威奇群島
🇬🇹 GT 危地馬拉
🇬🇺 GU 關島
🇬🇼 GW 畿內亞比紹
🇬🇾 GY 圭亞那
🇭🇰 HK 香港
🇭🇲 HM 赫德島和麥克唐納群島
🇭🇳 HN 洪都拉斯
🇭🇷 HR 克羅地亞
🇭🇹 HT 海地
🇭🇺 HU 匈牙利
🇮🇨 IC 加納利群島
🇮🇩 ID 印尼
🇮🇪 IE 愛爾蘭
🇮🇱 IL 以色列
🇮🇲 IM 萌島
🇮🇳 IN 印度
🇮🇴 IO 英屬印度洋領地
🇮🇶 IQ 伊拉克
🇮🇷 IR 伊朗
🇮🇸 IS 冰島
🇮🇹 IT 意大利
🇯🇪 JE 澤西
🇯🇲 JM 牙買加
🇯🇴 JO 約旦
🇯🇵 JP 日本
🇰🇪 KE 肯雅
🇰🇬 KG 吉爾吉斯
🇰🇭 KH 柬埔寨
🇰🇮 KI 基里巴斯
🇰🇲 KM 科摩羅
🇰🇳 KN 聖基茨和尼維斯
🇰🇵 KP 北韓
🇰🇷 KR 南韓
🇰🇼 KW 科威特
🇰🇾 KY 開曼群島
🇰🇿 KZ 哈薩克
🇱🇦 LA 老撾
🇱🇧 LB 黎巴嫩
🇱🇨 LC 聖盧西亞
🇱🇮 LI 列支敦士登
🇱🇰 LK 斯里蘭卡
🇱🇷 LR 利比里亞
🇱🇸 LS 萊索托
🇱🇹 LT 立陶宛
🇱🇺 LU 盧森堡
🇱🇻 LV 拉脫維亞
🇱🇾 LY 利比亞
🇲🇦 MA 摩洛哥
🇲🇨 MC 摩納哥
🇲🇩 MD 摩爾多瓦
🇲🇪 ME 黑山
🇲🇫 MF 法屬聖馬丁
🇲🇬 MG 馬達加斯加
🇲🇭 MH 馬紹爾群島
🇲🇰 MK 北馬其頓
🇲🇱 ML 馬里
🇲🇲 MM 緬甸
🇲🇳 MN 蒙古國
🇲🇴 MO 澳門
🇲🇵 MP 北馬利安納群島
🇲🇶 MQ 馬提尼克
🇲🇷 MR 毛里塔尼亞
🇲🇸 MS 蒙特塞拉特
🇲🇹 MT 馬耳他
🇲🇺 MU 毛里裘斯
🇲🇻 MV 馬爾代夫
🇲🇼 MW 馬拉維
🇲🇽 MX 墨西哥
🇲🇾 MY 馬來西亞
🇲🇿 MZ 莫桑比克
🇳🇦 NA 納米比亞
🇳🇨 NC 新喀里多尼亞
🇳🇪 NE 尼日爾
🇳🇫 NF 諾福克島
🇳🇬 NG 尼日利亞
🇳🇮 NI 尼加拉瓜
🇳🇱 NL 荷蘭
🇳🇴 NO 挪威
🇳🇵 NP 尼泊爾
🇳🇷 NR 瑙魯
🇳🇺 NU 紐埃
🇳🇿 NZ 紐西蘭
🇴🇲 OM 阿曼
🇵🇦 PA 巴拿馬
🇵🇪 PE 秘魯
🇵🇫 PF 法屬波利尼西亞
🇵🇬 PG 巴布亞新畿內亞
🇵🇭 PH 菲律賓
🇵🇰 PK 巴基斯坦
🇵🇱 PL 波蘭
🇵🇲 PM 聖皮埃爾和密克隆
🇵🇳 PN 皮特肯群島
🇵🇷 PR 波多黎各
🇵🇸 PS 巴勒斯坦
🇵🇹 PT 葡萄牙
🇵🇼 PW 帕勞
🇵🇾 PY 巴拉圭
🇶🇦 QA 卡塔爾
🇷🇪 RE 留尼旺
🇷🇴 RO 羅馬尼亞
🇷🇸 RS 塞爾維亞
🇷🇺 RU 俄羅斯
🇷🇼 RW 盧旺達
🇸🇦 SA 沙地阿拉伯
🇸🇧 SB 所羅門群島
🇸🇨 SC 塞舌爾
🇸🇩 SD 蘇丹
🇸🇪 SE 瑞典
🇸🇬 SG 新加坡
🇸🇭 SH 聖海倫娜
🇸🇮 SI 斯洛文尼亞
🇸🇯 SJ 斯瓦爾巴和揚馬延
🇸🇰 SK 斯洛伐克
🇸🇱 SL 塞拉利昂
🇸🇲 SM 聖馬力諾
🇸🇳 SN 塞內加爾
🇸🇴 SO 索馬里
🇸🇷 SR 蘇里南
🇸🇸 SS 南蘇丹
🇸🇹 ST 聖多美和普林西比
🇸🇻 SV 薩爾瓦多
🇸🇽 SX 荷屬聖馬丁
🇸🇾 SY 敘利亞
🇸🇿 SZ 斯威士蘭
🇹🇦 TA 特里斯坦-達庫尼亞
🇹🇨 TC 特克斯和凱科斯群島
🇹🇩 TD 乍得
🇹🇫 TF 法屬南部和南極領地
🇹🇬 TG 多哥
🇹🇭 TH 泰國
🇹🇯 TJ 塔吉克
🇹🇰 TK 托克勞
🇹🇱 TL 東帝汶
🇹🇲 TM 土庫曼
🇹🇳 TN 突尼西亞
🇹🇴 TO 湯加
🇹🇷 TR 土耳其
🇹🇹 TT 千里達和多巴哥
🇹🇻 TV 圖瓦盧
🇹🇼 TW 臺灣[註 2]
🇹🇿 TZ 坦桑尼亞
🇺🇦 UA 烏克蘭
🇺🇬 UG 烏干達
🇺🇲 UM 美國本土外小島嶼
🇺🇳 UN 聯合國
🇺🇸 US 美國
🇺🇾 UY 烏拉圭
🇺🇿 UZ 烏茲別克
🇻🇦 VA 梵蒂岡
🇻🇨 VC 聖文森特和格林納丁斯
🇻🇪 VE 委內瑞拉
🇻🇬 VG 英屬處女群島
🇻🇮 VI 美屬處女群島
🇻🇳 VN 越南
🇻🇺 VU 瓦努阿圖
🇼🇫 WF 瓦利斯和富圖納
🇼🇸 WS 薩摩亞
🇽🇰 XK 科索沃
🇾🇪 YE 也門
🇾🇹 YT 馬約特
🇿🇦 ZA 南非
🇿🇲 ZM 贊比亞
🇿🇼 ZW 津巴布韋
已棄用的文字序列
已棄用的文字序列 取而代之的文字序列[10][11]
代碼 區域 旗幟 代碼 區域 JoyPixels可能的渲染結果
AN 荷屬安的列斯 🇨🇼 CW 庫拉索
🇸🇽 SX 荷屬聖馬丁
🇧🇶 BQ 荷蘭加勒比區
BU 緬甸 🇲🇲 MM 緬甸
CS 塞爾維亞和黑山 🇷🇸 RS 塞爾維亞
🇲🇪 ME 黑山
DD 東德 🇩🇪 DE 德國
FX 法國本土 🇫🇷 FR 法國
NT 沙地阿拉伯-伊拉克中立區 🇸🇦 SA 沙地阿拉伯
🇮🇶 IQ 伊拉克
QU 歐盟 🇪🇺 EU 歐盟
SU 蘇聯 🇷🇺 RU 俄羅斯
🇦🇲 AM 亞美尼亞
🇦🇿 AZ 阿塞拜疆
🇧🇾 BY 白俄羅斯
🇪🇪 EE 愛沙尼亞
🇬🇪 GE 格魯吉亞
🇰🇿 KZ 哈薩克
🇰🇬 KG 吉爾吉斯
🇱🇻 LV 拉脫維亞
🇱🇹 LT 立陶宛
🇲🇩 MD 摩爾多瓦
🇹🇯 TJ 塔吉克
🇹🇲 TM 土庫曼
🇺🇦 UA 烏克蘭
🇺🇿 UZ 烏茲別克
TP 東帝汶 🇹🇱 TL 東帝汶
YD 南也門 🇾🇪 YE 也門
YU 塞爾維亞和黑山 🇷🇸 RS 塞爾維亞
🇲🇪 ME 黑山
ZR 扎伊爾 🇨🇩 CD 剛果民主共和國

Unicode區段

[編輯]
圍繞字母數字補充區段英語Enclosed Alphanumeric Supplement[1]的區域指示符部分

Unicode聯盟官方碼表頁面存檔備份,存於互聯網檔案館) (PDF)

  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1F1Ex (U+1F100–U+1F1E5 已省略)   🇦     🇧     🇨     🇩     🇪     🇫     🇬     🇭     🇮     🇯  
U+1F1Fx   🇰     🇱     🇲     🇳     🇴     🇵     🇶     🇷     🇸     🇹     🇺     🇻     🇼     🇽     🇾     🇿  
Notes
1.^ 依據Unicode 13.0

背景

[編輯]

在2007年,Unicode收到了一份對於廣泛使用的繪文字編碼提案,這份提案上的繪文字主要出自日本通訊公司NTT DOCOMOKDDI軟銀集團之手。[12]提案中的符號包含了下列十面旗幟[13] 中國(🇨🇳)、 德國(🇩🇪)、 西班牙(🇪🇸)、 法國(🇫🇷)、 英國(🇬🇧)、 意大利(🇮🇹)、 日本(🇯🇵)、 南韓(🇰🇷)、 俄羅斯(🇷🇺)和 美國(🇺🇸)。有觀點認為,僅僅對於這十面旗幟編碼這一做法包含偏見。[14]一個被駁回的編碼提案是,在保留旗幟的情況下,稱它們為「繪文字相容字元-n」(EMOJI COMPATIBILITY SYMBOL-n)並以標準「EC n」顯示,而不展示它們代表的旗幟;[15]另一個被駁回的提案為676種雙字母組合中每一種都分配了碼位,以ISO 3166標準(如FR代表法國)或國家和地區頂級域(如EU代表歐盟)與旗幟對應。[16]

最終被接受的方案添加了與拉丁字母相對應的26個字元以表示區域指示符,當其按照上文的序列出現時會呈現出對應的旗幟,同時為繪文字的擴充預留了空間以供後續添加。[2]根據Unicode標準,「此類[區域指示符的]組合的主要目的是,為表情符號核心集合中使用的特定字元提供明確雙向對映」(the main purpose of such [regional indicator symbol] pairs is to provide unambiguous roundtrip mappings to certain characters used in the emoji core sets[17],此處特指以下十面國旗:[18]🇨🇳、🇩🇪、🇪🇸、🇫🇷、🇬🇧、🇮🇹、🇯🇵、🇰🇷、🇷🇺和🇺🇸。

由於Unicode的區域指示符只提供地區代碼、不提供旗幟,特定的系統可以採取不渲染字元的方式以避免引起非議。如在台灣問題中,對於實際統治台灣地區台北政府北京政府拒絕承認,因此在中國大陸的新聞媒體報道中,中華民國國旗會被作馬賽克處理,而在大陸法律下的電子產品,「🇹🇼」也會顯示為字元缺失或不作為旗幟顯示。[19][20]

參見

[編輯]

註釋

[編輯]

參考文獻

[編輯]
  1. ^ Andrew West. What's new in Unicode 6.0. Babelstone. [2014-08-18]. (原始內容存檔於2014-04-06). 
  2. ^ 2.0 2.1 Michael Everson and Ken Whistler. N3727: Proposal to encode Regional Indicator Symbols in the UCS (PDF). Working Group Document, ISO/IEC JTC1/SC2/WG2 and UTC. [2014-08-18]. (原始內容存檔 (PDF)於2015-07-31). 
  3. ^ Unicode FAQ: Emoji and Dingbats. The Unicode Consortium. 2009-10-28 [2014-08-18]. (原始內容存檔於2014-07-26). 
  4. ^ Enclosed Alphanumeric Supplement, Range 1F100 - 1F1FF, The Unicode Standard, Version 6.0 (PDF). Unicode Consortium. 2010 [2014-08-18]. (原始內容存檔 (PDF)於2015-07-30). 
  5. ^ Flags. emojipedia.com. [2020-02-04]. (原始內容存檔於2020-01-31). 
  6. ^ 6.0 6.1 UTR #51: Unicode Emoji, Annex B: Valid Emoji Flag Sequences, Unicode Consortium web, 2020-02-11 [2020-07-11], (原始內容存檔於2020-06-30) 
  7. ^ UTR #35: Unicode Locale Data Markup Language (LDML), Validity Data. Unicode Consortium. [2020-07-11]. (原始內容存檔於2020-07-14). 
  8. ^ CLDR v37 Region Validity Data. Unicode Common Locale Data Repository (CLDR). 2020-04-23. [失效連結]
  9. ^ UCD: Emoji Sequence Data for UTR #51. Unicode Consortium. 2020-01-28 [2020-07-11]. (原始內容存檔於2024-03-27). 
  10. ^ UTR #35: Unicode Locale Data Markup Language (LDML), Supplemental Metadata. Unicode Consortium. [2020-07-11]. (原始內容存檔於2020-07-11). 
  11. ^ CLDR v37 Supplemental Metadata. Unicode Common Locale Data Repository (CLDR). 2020-04-23. [失效連結]
  12. ^ Momoi, Kat; Davis, Mark; Scherer, Markus. L2/07-257: Working Draft Proposal for Encoding Emoji Symbols. 2007-08-03 [2014-08-18]. (原始內容存檔於2014-07-12). 
  13. ^ Unicode Mapping for Emoji with Reference to Japanese Carriers, AU/KDDI, DoCoMo, and Softbank (ZIP archive file format). [2014-08-18]. (原始內容存檔於2015-07-31). 
  14. ^ L2/09-114 N3607: Towards an encoding of symbol characters used as emoji (PDF). 2009-04-06 [2014-08-18]. (原始內容存檔 (PDF)於2015-07-31). 
  15. ^ INCITS/L2/09-304: Comments accompanying the U.S. negative vote on PDAM 8 to ISO/IEC 10646:2003 (SC2 N4078) (PDF). 2009-08-15 [2014-08-18]. (原始內容存檔 (PDF)於2015-07-31). 
  16. ^ Pentzlin, Karl. L2/08-305: Some suggestions about the encoding of national flags as requested by the Emoji proposal (PDF). 2008-08-09 [2014-08-18]. (原始內容存檔 (PDF)於2015-05-01). 
  17. ^ The Unicode Standard, Version 6.2, Chapter 15: Symbols (PDF). Unicode, Inc. September 2012: 534 [2020-07-11]. ISBN 978-1-936213-07-8. (原始內容存檔 (PDF)於2020-08-09). 
  18. ^ Emoji Sources (plain text). Unicode, Inc. 2013-12-17 [2014-08-18]. (原始內容存檔於2014-08-23). 
  19. ^ 法制網數十家世界500強外企官網錯誤標識我國港澳台地區 專家建議依法處置錯誤標識中國領土行為頁面存檔備份,存於互聯網檔案館
  20. ^ 港澳iOS 13中華民國國旗被「河蟹」消失無蹤 港網民議論 - 科技. 中時新聞網. 2019-10-08 [2023-05-24]. (原始內容存檔於2020-07-11) (中文(臺灣)).