中日韓筆畫 (Unicode區段)
中日韓筆畫 | |
---|---|
範圍 | U+31C0..U+31EF (48個碼位) |
平面 | 基本多文種平面(BMP) |
文字 | 通用 |
已分配 | 39個碼位 |
未分配 | 11個保留碼位 |
來源標準 | HKSCS–2001 |
統一碼版本歷史 | |
4.1 | 16 (+16) |
5.1 | 36 (+20) |
15.1 | 37 (+1) |
16.0 | 39 (+2) |
註釋:[1][2] |
中日韩笔画是一个位于基本多文种平面的Unicode区段,于 U+31C0..U+31E4 收入了38种笔画。Unicode 15.1起還加入了一個表意文字描述字符。
码表
[编辑]中日韩笔画 CJK Strokes[1][2] Unicode 联盟官方码表 (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+31Cx | ㇀ | ㇁ | ㇂ | ㇃ | ㇄ | ㇅ | ㇆ | ㇇ | ㇈ | ㇉ | ㇊ | ㇋ | ㇌ | ㇍ | ㇎ | ㇏ |
U+31Dx | ㇐ | ㇑ | ㇒ | ㇓ | ㇔ | ㇕ | ㇖ | ㇗ | ㇘ | ㇙ | ㇚ | ㇛ | ㇜ | ㇝ | ㇞ | ㇟ |
U+31Ex | ㇠ | ㇡ | ㇢ | ㇣ | | | | |||||||||
注釋 |
历史
[编辑]以下Unicode文档记录了与这一区段相关的提案:
Unicode 版本 |
最終碼位範圍[a] | 碼位數 | L2 ID | WG2 ID | 表意文字小組 ID | 文檔 |
---|---|---|---|---|---|---|
4.1 | U+31C0..31CF | 16 | L2/03-411 | Goldsmith, Deborah; Muller, Eric, Unencoded chars in GB 18030 & HK-SCS, 2003-10-31 | ||
L2/04-161R | N2807 | Suignard, Michel; Muller, Eric; Jenkins, John, HKSCS and GB 18030 PUA characters, background document, 2004-06-17 | ||||
L2/04-263 | N2808 | Suignard, Michel, HKSCS and GB 18030 PUA characters, request for additional characters and related information, 2004-06-17 | ||||
L2/05-058 | Whistler, Ken, C. Changes to CJK strokes block, WG2 Consent Docket, Part 1: Unicode 4.1 Issues, 2005-02-03 | |||||
L2/05-026 | Moore, Lisa, WG2 - Unicode 4.1 Consent Docket (B.1.16.1), UTC #102 Minutes, 2005-05-16 | |||||
5.1 | U+31D0..31E3 | 20 | L2/03-387 | N986 | Cook, Richard, Chinese Character Description Language (CDL), 2003-10-26 | |
L2/03-404 | N985 | Bishop, Thomas; Cook, Richard, A Specification for CDL -- Character Description Language, 2003-10-28 | ||||
L2/03-420 | N987 | Bishop, Thomas; Cook, Richard, Character Description Language (CDL): The Set of Basic CJK Unified Stroke Types, 2003-11-04 | ||||
L2/04-221 | N2817 | N1096 | Bishop, Thomas; Cook, Richard, Proposal to add a block of CJK Unified Basic Strokes to the UCS, 2004-06-07 | |||
L2/04-367 | N2864 | N1097 | Bishop, Thomas; Cook, Richard, Proposal to add a block of CJK Basic Strokes to the UCS, 2004-10-25 | |||
L2/06-212 | N3063 | N1180 | Lu, Qin, Proposed additions to the CJK Strokes block of the UCS, 2006-04-03 | |||
L2/06-108 | Moore, Lisa, C.4, UTC #107 Minutes, 2006-05-25 | |||||
N3103 (pdf, doc) | Umamaheswaran, V. S., M48.12, Unconfirmed minutes of WG 2 meeting 48, Mountain View, CA, USA; 2006-04-24/27, 2006-08-25 | |||||
L2/23-221 | Koo, Night, Proposal to modify the representative glyph of U+31D2 CJK STROKE P, 2023-10-01 | |||||
L2/23-237R | Lunde, Ken, 19, CJK & Unihan Group Recommendations for UTC #177 Meeting, 2023-11-02 | |||||
L2/23-231 | Constable, Peter, Section 19, UTC #177 Minutes, 2023-12-08, Consensus 177-C14: Accept the proposal to change the representative glyph for U+31D2 | |||||
15.1 | U+31EF | 1 | L2/21-118R | N2492 | Lunde, Ken; Jenkins, John H., Preliminary proposal to add a new provisional kIDS property (Unihan), 2021-08-11 | |
L2/22-136 | West, Andrew, Feedback on Proposals to Encode New Ideographic Description Characters, 2022-07-08 | |||||
L2/22-191 | N2572 | Lunde, Ken; Jenkins, John; West, Andrew, Proposal to encode five new Ideographic Description Characters, 2022-08-24 | ||||
L2/22-227 | SAT Feedback to "Preliminary proposal to add a new provisional kIDS property (Unihan)" (IRGN2492) and "Proposal to encode five new Ideographic Description Characters" (IRGN2572), 2022-08-29 | |||||
L2/22-228 | Fan, Ming, Feedback on IRGN2572 "Proposal to encode 5 new ideograph description characters", 2022-09-02 | |||||
L2/22-247 | Lunde, Ken, 29, CJK & Unihan Group Recommendations for UTC #173 Meeting, 2022-11-01 | |||||
L2/22-241 | Constable, Peter, E.1 29, Approved Minutes of UTC Meeting 173, 2022-11-09 | |||||
16.0 | U+31E4..31E5 | 2 | L2/23-220 | N2647 | Koo, Night, Proposal to encode (disunify) two stroke characters in CJK Strokes block, 2023-10-01 | |
L2/23-237R | Lunde, Ken, 18, CJK & Unihan Group Recommendations for UTC #177 Meeting, 2023-11-02 | |||||
L2/23-231 | Constable, Peter, Section 18, UTC #177 Minutes, 2023-12-08 | |||||
L2/24-044 | Koo, Night, Correcting the proposed name of new character U+31E4 in Unicode 16.0, 2024-02-19 | |||||
L2/24-067 | Lunde, Ken, 32 [Affects U+31E4], CJK & Unihan Working Group Recommendations for UTC #179 Meeting, 2024-04-19 | |||||
L2/24-061 | Constable, Peter, Section 32, UTC #179 Minutes, 2024-04-29, Consensus 179-C17: Accept the proposal to change the name of U+31E4, from CJK STROKE HZXG to CJK STROKE HXG | |||||
|
認同及收錄問題
[编辑]有許多實際存在的筆畫,Unicode都沒收錄。當中有不少是因為被Unicode視為可以與其他筆畫合併,例如:
- 斜橫()被視為可與橫()合併。
- 斜豎()、右斜豎()被視為可與豎()合併。
- 左點()、直點()被視為可與點()合併。
- 橫捺()、挑扁捺()被視為可與挑捺()合併。
- 扁捺()被視為可與捺()合併。
- 橫斜()被視為可與橫撇()合併。
- 挑鈎()被視為可與橫鈎()合併。
- 橫撇鈎()、挑撇鈎()被視為可與橫豎鈎()合併。
- 撇橫撇()被視為可與豎橫撇()合併。
- 撇橫()被視為可與豎橫()合併。
- 撇橫彎鈎()被視為可與豎橫彎鈎()合併。
- 直撇點()被視為可與撇點()合併……等等。
然而,在部份標準裏,這些筆畫是不可以合併的。例如明體的「辶」部,若把其挑扁捺更換作捺,字形不但變得詭異,甚至可能被視為錯字。这些合并的笔画可能只是在某些字、某些情況裏與別的筆畫相通,並不一定在任何情況下,都能用別的筆畫取代。
按Unicode 15.0之前的编码,豎橫撇()被視為可與豎橫豎()合併;但是若「夨」字的撇橫撇被更換作豎橫豎,将会變成錯字。又如橫曲鈎和橫捺鈎在中国国家规范 GF 2001-2001《GB 13000.1字符集汉字折笔规范》[3]和傳承字形推薦形體[4]裏有區分(如“九”和“讯”右边),但是按Unicode 15.0也被视为可合併。2024年的Unicode 16.0收录了橫捺鈎(或横斜勾,U+31E4)和竖横撇(U+31E5),解决了表述这两个笔画的问题[5]。
另外有少數在香港增補字符集中的筆畫或單筆畫漢字,在舊版中放在私人造字區裏,在新版時改爲對應到「中日韓統一漢字」的「擴展B(Ext-B)」區。GBK也将橫曲鈎定义在私用区,后续在GB 18030-2005内改为U+2E84;GB 18030-2000则在私用区U+E818放置橫撇鉤,但因为GB 18030-2005收录了扩展B区的汉字却没有修改对应导致GB 18030-2005内存在两个橫撇鉤(U+200CC和U+E818)[6]。連同部份單筆畫漢字,可數出「⺄〇一丨丿丶乀乁乙乚乛亅𠃉𠃊𠃋𠃌𠃍𠃎𠃑𠄌𠄎𡿨」這些字元,詳述如下:
編碼 | 筆畫 | HKSCS舊編碼 | 備註 |
---|---|---|---|
2E84 | ⺄ | GBK私用区定义为U+E819,形同「」(31E4)。与「㇈」(31C8)不同。 | |
3007 | 〇 | 形同「㇣」(31E3)。 | |
4E00 | 一 | 形同「㇐」(31D0)。 | |
4E28 | 丨 | 形同「㇑」(31D1)。 | |
4E3F | 丿 | 形近「㇓」(31D3),但也有字型製成形近「㇒」(31D2)。 | |
4E36 | 丶 | 形同「㇔」(31D4)。 | |
4E40 | 乀 | 形近「㇝」(31DD),但也有字型製成形近「㇏」(31CF)。 | |
4E41 | 乁 | 形近「㇝」(31DD)。 | |
4E59 | 乙 | 形同「㇠」(31E0)。 | |
4E5A | 乚 | 形同「㇟」(31DF)。 | |
4E5B | 乛 | 形同「㇖」(31D6)。 | |
4E85 | 亅 | 形同「㇚」(31DA)。 | |
200C9 | 𠃉 | ||
200CA | 𠃊 | F311 | 形同「㇗」(31D7)。 |
200CB | 𠃋 | F30E | 撇挑,非撇橫。與「㇜」(31DC)不同形。 |
200CC | 𠃌 | GB 18030-2000在私用区定义为U+E818;GB 18030-2005同时收录二字。形近「㇆」(31C6)。不少字型把U+200CC製成橫撇鉤,把U+31C6製成橫豎鉤。 | |
200CD | 𠃍 | F30B | 形同「㇕」(31D5)。 |
200CE | 𠃎 | 形近「㇘」(31D8)。 | |
200D1 | 𠃑 | F30A | 形同「㇞」(31DE)。 |
2010C | 𠄌 | F308 | 豎挑,非豎橫。形同「㇙」(31D9),但與「㇗」(31D7)不同。 |
2010E | 𠄎 | F316 | 形同「㇡」(31E1)。 |
21FE8 | 𡿨 | F30F | 形同「㇛」(31DB)。 |
參考文獻
[编辑]- ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2017-09-25).
- ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29).
- ^ 中华人民共和国教育部,国家语言文字工作委员会. GF2001-2001 《GB13000.1 字符集汉字折笔规范》 (PDF). 2002: 7 [2024-03-14].
- ^ I.字坊編輯部. 傳承字形部件檢校表 (PDF). 傳承字形標準化文件 1.36. 一點字坊. 2022年9月17日 [2024-03-14] (中文(繁體)).
- ^ 引用错误:没有为名为
unicode16-newstrokes
的参考文献提供内容 - ^ GB 18030 編碼表. 中文編碼網頁. [2021-12-03]. (原始内容存档于2022-05-26).