幽靈漢字
幽靈漢字(日語:幽霊漢字/ゆうれいかんじ Yūrē kanji */?),又稱幽靈文字(日語:幽霊文字/ゆうれいもじ Yūrē moji)是JIS基本漢字所收錄的出處不明漢字的總稱。
概述
[編輯]1978年,當時的通商產業省制定的JIS C 6226(後來的JIS X 0208)中規定了JIS第1、第2水準漢字6349字。該漢字集稱為「JIS基本漢字」。當時以下列4個漢字表為典據,採用了其中的漢字:[1]。
- 標準碼用漢字表(試案)(標準コード用漢字表(試案)):情報處理學會漢字碼委員會(1971年)
- 國土行政區劃總覽(国土行政区画総覧):國土地理協會(1972年)
- 日本生命收容人名漢字(日本生命収容人名漢字):日本生命(1973年,現已不存)
- 行政情報處理用基本漢字(行政情報処理用基本漢字):行政管理廳(1975年)
但制定JIS基本漢字時,由於規格未要求明示各文字的典據,JIS基本漢字中出現了不少不僅音、義、歷史,而且連用例都不明確的文字,即所謂的「幽靈文字」,大約有60字,一說超過100字。
垉(52區21點) | 垈(52區18點) | 墸(52區55點) |
壥(52區63點) | 妛(54區12點) | 岾(54區19點) |
彁(55區27點) | 恷(55區78點) | 挧(57區43點) |
暃(58區83點) | 椦(59區91點) | 橸(60區81點) |
汢(61區73點) | 熕(63區80點) | 碵(66區83點) |
穃(67區46點) | 粐(68區68點) | 粭(68區70點) |
粫(68區72點) | 糘(68區84點) | 膤(71區19點) |
蟐(74區12點) | 袮(74區57點) | 軅(77區32點) |
鍄(78區93點) | 閠(79區64點) | 靹(80區56點) |
駲(81區50點) | 鵈(82區94點) |
最具代表性的有「妛」、「彁」等字,不僅《康熙字典》中未收錄,追加了國字、新字體等的諸橋轍次的《大漢和辭典》(2000年補充了含部分JIS基本漢字的《補卷》除外)中也沒有記載。
基於此情況,1997年制定改定規格時,其原案作成委員會以委員長芝野耕司和國立國語研究所的笹原宏之等人為中心,調查了1978年規格的原案編制時參考的文獻。其結果是原本被視為幽靈漢字的,多數為地名等實際有使用的漢字。
根據調查,早於1978年規格原案編制,行政管理廳在1974年整理包括上述1-3的8個漢字表並編制了《以行政情報處理用標準漢字選定為目標的漢字使用頻度及對應分析結果》(行政情報処理用標準漢字選定のための漢字の使用頻度および対応分析結果,下稱「對應分析結果」),其中漢字表和原典均有記載。選定JIS基本漢字時參照的是對應分析結果而非原典,調查發現其中包含了很多來源於《國土行政區畫總覽》《日本生命收容人名漢字》的幽靈文字。特別是《日本生命收容人名漢字》在第1次規格的原案編制時,原典已經佚失,因此被批評為內容存在缺陷。[2]在此結果基礎上,改定規格的委員會用校正履歷復原了《國土行政區畫總覽》1972年版,並逐頁校覈其中出現的漢字。此外,他們以日本電信電話(NTT)和日本電信電話公社(電電公社)的電話簿資料庫為名用例,取代現已不存的《日本生命收容人名漢字》,進行比較調查,並以30本以上的古今的字書為調查對象,進行徹底的文獻參照。
另一方面,經過嚴密的調查後,仍有12個漢字來源不明。儘管多數來源不明的漢字也發現有各種線索,例如和古字書同形衝突的文字,或推測為資料傳抄時出錯,但是其中仍有「彁」這一字無任何線索[3]。因此,現時真正的幽靈漢字為此12字,狹義上則只有「彁」一字。
調查結果
[編輯]前述的笹原宏之的調查結果整理收錄於JIS X 0208:1997附屬書7《區點位置詳說》。本節選錄其中一部分。
出處不明的漢字
[編輯]字 | 碼位 | 來源 | 偶然一致例 |
---|---|---|---|
墸 | 52-55 | 來源不明。有偶合的例子。 | 《集韻》抄本中有,但或為誤寫;又可能是「躇」的異體字 |
壥 | 52-63 | 來源不明。可能是「㕓」的誤寫。 | 《倭玉篇》 |
妛 | 54-12 | 來源為《國土行政區劃總覽》,但未發現。可能是「𡚴」的誤認。 | 《字鏡集》等中有,但或為誤寫 |
彁 | 55-27 | 對應分析結果中無(來源不明)。可能是「彊」的誤寫。 | 無法同定 |
挧 | 57-45 | 來源為《國土行政區劃總覽》,但未發現。可能是「栩」的誤寫。 | 《中華字海》等 |
暃 | 58-83 | 來源為《國土行政區劃總覽》,但未發現。可能是「杲」等的誤寫。 | 《法華三大部難字記》 |
椦 | 59-91 | 來源為《國土行政區劃總覽》,但未發現。可能是「橳」的誤寫。 | 《一切經音義》 |
槞 | 60-57 | 來源為《國土行政區劃總覽》,但未發現。可能是「橦」的誤寫。 | 《宋元以來俗字譜》 |
蟐 | 74-12 | 來源為《行政情報處理基本漢字》,但無用例。 | 《新撰字鏡》 |
袮 | 74-57 | 來源為《國土行政區劃總覽》,但未發現。可能是「祢」的誤寫。 | 《新撰字鏡》《類聚名義抄》等 |
閠 | 79-64 | 來源為《國土行政區劃總覽》,但未發現。可能是「閏」的錯別字。 | 宋版《廣韻》中有,但或為誤寫 |
駲 | 81-50 | 來源為《日本生命人名表》,但原典已丟失。 | 《類聚名義抄》 |
- 可能為來源資料中存在但規格中未收錄文字之誤寫的文字
- 「壥」:對應分析結果中包含的「㕓」未收錄於JIS基本漢字,因此可能是登錄了其誤字體[4]。「㕓」在JIS X 0213中仍未收錄。
- 「妛」:位於滋賀縣犬上郡多賀町河內的「𡚴原」(あけんばら)的「𡚴」(「山女」的合字)未在JIS基本漢字中收錄,因此可能是登錄了其誤字體。其來源《國土行政區畫總覽》製作原稿時,因用紙張剪貼造字,發現其縫隙產生了印刷痕跡,故推測該印刷痕跡可能被錯誤地傳抄為橫畫[4][5]。「𡚴」於JIS X 0213中收錄。
- 「椦」:位於群馬縣前橋市的「橳島」(ぬでしま)[6]的「橳」(植物鹽膚木日語別名「勝の木/カチノキ」的合字)未在JIS基本漢字中收錄,因此可能是登錄了其誤字體[4]。「橳」於JIS X 0213中收錄。
出處已判明的漢字
[編輯]文字 | 碼位 | 來源 |
---|---|---|
垈 | 52-18 | 《國土行政區畫總覽》中有用例:藤垈(ふじぬた)、相垈(あいぬた)、大垈(おんた)/山梨縣 |
垉 | 52-21 | 《國土行政區畫總覽》中有用例。垉六(ほうろく)/愛知縣 |
岾 | 54-19 | 《國土行政區畫總覽》中有用例,但現已不存。広岾町(ひろやまちょう)→広帖町(こうちょうちょう)/京都府 |
恷 | 55-78 | 出典為《日本生命人名表》。NTT電話簿中有人名用例。 |
橸 | 60-81 | 《日本地名大辭典》中有用例。石橸(いしだる)/靜岡縣 |
汢 | 61-73 | 《國土行政區畫總覽》中有用例,但原典中為誤字。汢の川→の川(ぬたのかわ)[7]/高知縣。2002年1月1日,考慮到便利性和用例,改用「汢」。有偶然一致例。 |
碵 | 66-83 | 出自《日本生命人名表》。NTT電話簿中有人名用例。 |
穃 | 67-46 | 《國土行政區畫總覽》中有用例,但原典中為誤字。穃原→榕原(ようばる)/沖繩縣 |
粐 | 68-68 | 《國土行政區畫總覽》中有用例。粐蒔沢(ぬかまきざわ)[8]/秋田縣 |
粭 | 68-70 | 《國土行政區畫總覽》中有用例。粭島(すくもじま)/山口縣 |
粫 | 68-72 | 《國土行政區畫總覽》中有用例,但原典中為誤字。粫田(うるちだ)→糯田(もちだ)/福島縣 |
糘 | 68-84 | 《國土行政區畫總覽》中有用例。糘尻(すくもじり)/廣島縣 |
膤 | 71-19 | 《國土行政區畫總覽》中有用例。膤割(ゆきわり)/熊本縣 |
軅 | 77-32 | 《國土行政區畫總覽》中有用例,但現已不存。軅飛(たかとぶ)→鷹飛(たかとび)/福島縣 |
鍄 | 78-93 | 《國土行政區畫總覽》中有用例。小鍄(こがすがい)/山形縣 |
鵈 | 82-94 | 《國土行政區畫總覽》中有用例,但原典中為誤字。鵈沢→鵃沢(みさごさわ)/福島縣。有偶然一致例 |
收錄於辭典
[編輯]JIS漢字標準制定後,一些新出版的辭典以JIS基本漢字全覆蓋為編纂方針。但由於JIS基本漢字中收錄的幽靈文字缺少典據,編纂時的處理方式各異,常見方式包括以下幾種。
- 附會套用讀音
- 對於已實裝JIS基本漢字的設備,儘管是幽靈漢字,為避免支援但無法輸入的尷尬情況,存在權宜地將其解釋為形聲字並賦予「音讀」的做法[9]。有鑑於此,一些辭典也收錄了這些套用的讀法。例如「彁=カ(ka)・セイ(sei)」、「椦=ケン(ken)」等。笹原宏之基於日本電子工業振興協會(今電子情報技術產業協會)發佈的調查報告(1982年)以及NEC(1982年)、日本IBM(1983年)的發行資料,批評這些讀音可能是附會套用的[10]。
- 視為形似文字的異體字
- 有辭典將「駲」作為「馴」的異體字[11]、將「軅」作為「軈」的異體字[12]等。但是這些辭典對該處理方法並未列出依據。
- 對於「妛」(上部為「山」下加一橫「一」),由於《大漢和辭典》、《康熙字典》收有非常近似的字「妛」(上部為「㞢」),有將其列為後者的異體字的做法[13]。這一點也在的JIS X 0208:1997的調查中作為偶然一致例來介紹。此外,Unicode將該二字統一到了一個碼位上。
- 解釋為偶然一致的別字
- 也有將「槞」解釋為「櫳」的異體字、將「鵈」解釋為「とび」意的國字的做法。這些也已在JIS X 0208:1997調查中作為偶然一致例介紹。儘管這很可能並非標準制定時的收錄意圖,但這種處理方式不侷限於幽靈文字的範疇,而是着重於收錄文字的解釋的通用性。
- 解釋為音義未詳字
- 直接解釋為讀音、意義不明。
殘留的原因
[編輯]笹原宏之等人對幽靈文字的調查是1997年的JIS漢字改正工作中的一環。JIS漢字改正曾於1983年的「83JIS改正」中,對字形、文字編碼作出大幅變更,引起了嚴重的混亂,而本次改正則不希望重蹈覆轍。另外,由於JIS漢字已經收錄於Unicode,此時對JIS的變更已經不僅是日本國內的問題。結果,幽靈文字不僅在JIS基本漢字中被保留,也可以透過電腦字型於全世界的電腦中使用。
用例
[編輯]原本來源不明的文字,即使弄清了其正字、字義,使用頻率依然不高。實際上,被判定為錯別字的漢字有時會用來代用本字,而至今仍來源不明的字有時會用來代用字形相似的文字,作為異字、代替字、俗字而存在。
另外,有人利用幽靈文字「來源不明」「讀法不明」的特性,將其作為暗號文書,即所謂「忍者文字」。
2011年,《朝日新聞》在自社數據庫以幽靈文字「彁」爲關鍵字檢索,命中一條大正12年(1923)2月23日的新聞,其中出現「埼玉自彁会」文本[14]。在掃描圖像更加清晰的「朝日新聞〈復刻版〉」中檢索同一新聞,可見原文本正是「埼玉自彊會」,而在舊版低分辨率掃描圖像中形似「彁」,《朝日新聞》據此更正了檢索系統文本。這也爲前文中笹原宏之在1997年JIS基本漢字修訂時對「彁」來自「彊」(「強」的異體字)之誤寫的推測提供了一條實例。但是,此篇1923年的新聞未必是「彁」的起源或唯一實例,1978年制訂的JIS基本漢字完全可能根據更早的材料誤識而收錄「彁」字,在此之後,《朝日新聞》電子化的員工才基於相似的誤識情形,得以調用已存在於JIS字符集的「彁」字。
日本作曲家LeaF以幽靈漢字爲標題創作曲目《彁》(讀爲「か」),收錄於遊戲《太鼓達人》[15]。
幽靈漢字在漢語中
[編輯]「幽靈漢字」是日語中的說法,不少幽靈漢字在漢語中有意義,如:
- 妛:古同「媸」,見《漢語大字典》。
- 墸:同「躇」,見《漢語大字典》。
- 壥:古同「廛」,見《漢語大字典》。
- 挧:姓。見《中華字海》。
- 槞:古同「櫳」,見《漢語大字典》。
- 閠:古同「閏」,見《漢語大字典》。
- 椦:古同「棬」,見《漢語大字典》。
- 彁:古同「遅」,見《後漢書律曆志》(可能)[16]
以下漢字仍無出處:
- 暃
- 蟐
- 駲
參考資料
[編輯]- ^ JIS X 0208:1997. 7ビット及び8ビットの2バイト情報交換用符号化漢字集合. 日本規格協會. 1997: pp.269f (日語).
- ^ 名字・名前と漢字 第9回. 大修館書店 WEB國語教室. [2019-11-17]. (原始內容存檔於2016-09-26).
- ^ 前掲、pp.291f。
- ^ 4.0 4.1 4.2 JIS X 0208:1997. 7ビット及び8ビットの2バイト情報交換用符号化漢字集合. 日本規格協會. 1997: p.288, pp.289f, p.292 (日語).
- ^ 笹原宏之. 日本の漢字. 岩波新書. 岩波書店. 2006: p.82. ISBN 4-00-430991-3 (日語).
- ^ 漢字の写真字典 国字(木 12). Yoshio Yoshida. 2013年4月 [2016年12月13日]. (原始內容存檔於2016年11月24日) (日語).
- ^ 根據當地役所,原本從兩點水「冫」。
- ^ JIS X 0208:1997の附屬書7《區點位置詳說》中誤植作「粐薪沢」。
- ^ 微軟日語輸入法(MS-IME)單漢字辭書、ATOK、Google日語輸入法等。此外,使用MS-IME的反查功能查詢相關文字,讀音為空白。
- ^ 比留間直和. 幽霊文字の読み、どこから ― 変換辞書のはなし5. 朝日新聞デジタル. 2011-08-22 [2017-04-14]. (原始內容存檔於2021-05-12).
- ^ 戸川芳郎. 漢辞海 第四版. 三省堂. 2016. ISBN 978-438-5-14048-3 (日語).
- ^ 鎌田正, 米山寅太郎. 新漢語林 第二版. 大修館. 2011. ISBN 978-446-9-03163-8 (日語).
- ^ 新村出. 広辞苑 第五版. 岩波書店. 1998. ISBN 978-400-0-80111-9 (日語).
- ^ 比留間 直和. 大正十二年の幽霊文字. ことばマガジン:朝日新聞デジタル. 2011-09-05 [2018-07-31]. (原始內容存檔於2018-07-30).
- ^ @7eaF. 【新曲/告知】「彁」 (推文). 2023-02-01 [2023-02-23] –透過Twitter.
- ^ 后汉书. www.njmuseum.com. [2024-10-31].
參見
[編輯]外部連結
[編輯]- YouTube上的幽霊文字の話(正体不明の漢字達)(日語)
- 比留間 直和. 大正十二年の幽霊文字. [2018-07-31]. (原始內容存檔於2018-07-30) (日語).(「彁」字被誤用於舊刊物電子化的事例)