Unicode中的音标符号
Unicode通过已有的书写系统和添加带音标字符的额外的区段支持一些音标文字和标记法。这些语音学符号产生于已有的文字,通常是拉丁文、希腊文或西里尔文。Unicode中没有专门的“国际音标字符”。除官方标准的国际音标外,这些区段还包括了已被现今标准规范废除的国际音标符号、乌拉尔音标、过去使用的汉语音调符号等。
音标字符
[编辑]国际音标利用来自其他书写系统最常用的标音字母。国际音标常使用拉丁字母、希腊字母和西里尔字母,组合用变音符号还补充语音文本的意义。最后,这些标音字母利用为表达语言学含义特别修订的字母。一个“修饰字母”不是作为独立的字母,但作为前面字符的修饰[1]产生有区别的字素,尤其是在国际音标中。例如,ʰ不是用来表达它本身,但修饰了前面的符号。因此,tʰ是单独的区别于t的国际音标符号。然而,这些“修饰字母”的一部分也用于全音素文字。例如,ʿ 用来转写闪米特语的ayin或夏威夷语okina,或者 ˚ 转写阿布哈兹语 ә。
从国际音标到Unicode
[编辑]辅音
[编辑]下表包含了国际音标用的音位的Unicode码点。加粗的码点表示Unicode图标提供应用程序注释,如U+026D ɭ LATIN SMALL LETTER L WITH RETROFLEX HOOK ,HTML:ɭ
用于“浊卷舌边音”。粗斜体表示字符名称本身标示了发音,如U+0298 ʘ LATIN LETTER BILABIAL CLICK ,HTML:ʘ
双唇 | 唇齿 | 齿 | 齿龈 | 龈后 | 卷舌 | 唇硬腭 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
塞音 | p 0070 | b 0062 | p̪ 0070 032A | b̪ 0062 032A | t̪ 0074 032A | d̪ 0064 032A | t 0074 |
d 0064 | ʈ 0288 | ɖ 0256 | ||||
内爆音 | ɓ̥ 0253 0325 | ɓ 0253 | ɗ̪ 0257 032A | ɗ 0257 | * | |||||||||
挤喉音 | pʼ 0070 02BC | t̪ʼ 0074 032A 02BC | tʼ 0074 02BC | ʈʼ 0288 02BC | ||||||||||
鼻音 | m̥ 006D 0325 | m 006D | ɱ̊ 0271 030A | ɱ 0271 | n̪̊ 006E 032A 030A | n̪ 006E 032A | n̥ 006E 0325 | n 006E | ɳ̊ 0273 030A | ɳ 0273 | ||||
颤音 | ʙ 0299 | r̥ 0072 0325 | r 0072 | * | ||||||||||
闪音 | ⱱ̟ 2C71 031F | ⱱ 2C71 | ɾ 027E | ɽ 027D | ||||||||||
边闪音 | ɺ 027A | * | ||||||||||||
擦音 | ɸ 0278 | β 03B2 | f 0066 |
v 0076 | θ 03B8 | ð 00F0 | s 0073 | z 007A | ʃ 0283 | ʒ 0292 | ʂ 0282 | ʐ 0290 | ||
边擦音 | ɬ 026C | ɮ 026E | * | |||||||||||
挤喉擦音 | sʼ 0073 02BC | ʃʼ 0283 02BC | ||||||||||||
挤喉边擦音 | ɬʼ 026C 02BC | |||||||||||||
敲击音 | ʬ 02AC |
ʭ 02AD |
||||||||||||
近音 | β̞̊ 03B2 031E 030A | β̞ 03B2 031E | ʋ̥ 028B 0325 | ʋ 028B | ð̞ 00F0 031E | ɹ̥ 0279 0325 | ɹ 0279 | ɻ̊ 027B 030A | ɻ 027B | ɥ̊ 0265 030A | ɥ 0265 | |||
边近音 | l̥ 006C 0325 | l 006C | ɭ 026D | |||||||||||
搭嘴音 | ʘ 0298 |
ǀ 01C0 |
ǃ 01C3 |
ǃ / ǂ 01C3 / 01C2 |
||||||||||
边搭嘴音 | * | ǁ 01C1 |
龈腭 | 硬腭 | 唇软腭 | 软腭 | 小舌 | 咽 | 会厌 | 声门 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
塞音 | ȶ 0236 | ȡ 0221 | c 0063 | ɟ 025F | k͡p 006B 0361 0070 | ɡ͡b 0261 0361 0062 | k 006B | ɡ 0261 | q 0071 | ɢ 0262 | ʡ 02A1 | ʔ 0294 | ||||
内爆音 | ʄ 0284 | ɠ 0260 | ʛ 029B | |||||||||||||
挤喉音 | cʼ 0063 02BC | kʼ 006B 02BC | qʼ 0071 02BC | |||||||||||||
鼻音 | ȵ 0235 | ɲ 0272 | ŋ͡m 014B 0361 006D | ŋ 014B | ɴ 0274 | |||||||||||
颤音 | ʀ 0280 | * | ||||||||||||||
闪音 | * | |||||||||||||||
边闪音 | * | * | ||||||||||||||
擦音 | ɕ 0255 | ʑ 0291 | ç 0063 0327 | ʝ 029D | x 0078 | ɣ 0263 | χ 03C7 | ʁ 0281 | ħ 0127 | ʕ 0295 | ʜ 029C | ʢ 02A2 | h 0068 | ɦ 0266 | ||
近音 | j 006A | ʍ 028D | w 0077 | ɰ 0270 | ||||||||||||
边近音 | ȴ 0234 | ʎ 028E | ʟ 029F |
元音
[编辑]下表描述了元音及其Unicode / UCS码点。表格中成对的元音分别地表示不圆唇和圆唇的变化。另外,带Unicode名称的字符以粗体标出。带有额外应用程序注释的字符以粗斜体标出。直接借用其他文字(拉丁字母、希腊字母或西里尔字母)的以斜体标出。
Unicode元音码点 | |||||
---|---|---|---|---|---|
本表格表示语音学上的元音图 圆点两边的元音格式为不圆唇 · 圆唇 | |||||
闭 | i · y 0069 0079 |
ɨ · ʉ 0268 0289 |
ɯ · u 026F 0075 | ||
次闭 | ɪ · ʏ 026A 028F |
ɪ̈ · ʊ̈ 026A 0308 · 028A 0308 |
· ʊ 028A |
||
半闭 | e · ø 0065 00F8 |
ɘ · ɵ 0258 0275 |
ɤ · o 0264 006F | ||
中 | ə 0259 |
||||
半开 | ɛ · œ 025B 0153 |
ɜ · ɞ 025C 025E |
ʌ · ɔ 028C 0254 | ||
次开 | æ · 00E6 |
ɐ 0250 |
|||
开 | a · ɶ 0061 0276 |
ɑ · ɒ 0251 0252 | |||
元音长度标记 | ː 02D0 |
Unicode区段
[编辑]不同于标准拉丁字母或希腊字母如m和ɛ,这些符号放在特定的语音学用区段:
- 國際音標擴展(0250–02AF)
- 占位修飾符號 (02B0–02FF)
- 音標擴展(1D00–1D7F)
- 音標擴展補充(1D80–1DBF)
- 聲調修飾符號(A700–A71F)
- 上標及下標(2070–209F)
从Unicode区段到文字
[编辑]语音学用的字符放在六个Unicode区段中。
国际音标扩展(U+0250–02AF)
[编辑]國際音標擴展 IPA Extensions[1] Unicode Consortium 官方碼表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+025x | ɐ | ɑ | ɒ | ɓ | ɔ | ɕ | ɖ | ɗ | ɘ | ə | ɚ | ɛ | ɜ | ɝ | ɞ | ɟ |
U+026x | ɠ | ɡ | ɢ | ɣ | ɤ | ɥ | ɦ | ɧ | ɨ | ɩ | ɪ | ɫ | ɬ | ɭ | ɮ | ɯ |
U+027x | ɰ | ɱ | ɲ | ɳ | ɴ | ɵ | ɶ | ɷ | ɸ | ɹ | ɺ | ɻ | ɼ | ɽ | ɾ | ɿ |
U+028x | ʀ | ʁ | ʂ | ʃ | ʄ | ʅ | ʆ | ʇ | ʈ | ʉ | ʊ | ʋ | ʌ | ʍ | ʎ | ʏ |
U+029x | ʐ | ʑ | ʒ | ʓ | ʔ | ʕ | ʖ | ʗ | ʘ | ʙ | ʚ | ʛ | ʜ | ʝ | ʞ | ʟ |
U+02Ax | ʠ | ʡ | ʢ | ʣ | ʤ | ʥ | ʦ | ʧ | ʨ | ʩ | ʪ | ʫ | ʬ | ʭ | ʮ | ʯ |
註釋
|
占位修饰符号(U+02B0–02FF)
[编辑]占位修饰符号区段里面的字符用来和前面的字母组成一个单元(即“修饰”)。如字符U+02B0 ʰ MODIFIER LETTER SMALL H不是简单的表示上标h(h),但是作为送气音符号放在字母后面表示送气,像是pʰ。这个区段包含了:
- 拉丁上标修饰符号(U+02B0–U+02B8): ʰ 送气 ʱ 呼气音 ʲ 腭音化 ʳ, ʴ, ʵ, ʶ 儿化或 r-offglides ʷ 唇化 ʸ 腭化,美式标音系统用(U+02B2)
- 杂项语音学修饰符(U+02B9–U+02D7):ʹ ʺ ʻ ʼ ʽ ʾ ʿ ˀ ˁ ˂ ˃ ˄ ˅ ˆ ˇ ˈ ˉ ˊ ˋ ˌ ˍ ˎ ˏ ː ˑ ˒ ˓ ˔ ˕ ˖ ˗
- 间隔用变音符号(U+02D8–U+02DD):˘ 抑扬符 ˙ 上点 ˚ 上圈; ˛ ogonek ˜ 腭化符; ˝ 双尖音符
- 基于1989年国际音标附加的(U+02DE–U+02E4):˞ ˟ ˠ ˡ ˢ ˣ ˤ
- 声调符号(U+02E5–U+02E9):˥ ˦ ˧ ˨ ˩
- 扩展注音符号声调标记:U+02EA ˪ YIN DEPARTING TONE MARK,U+02EB ˫ YANG DEPARTING TONE MARK
- 国际音标修饰字符:U+02EC ˬ MODIFIER LETTER VOICING,不送气
- 其他修饰符号:U+02EE ˮ MODIFIER LETTER DOUBLE APOSTROPHE,用于涅涅茨语
- 乌拉尔音标修饰符号(U+02EF–U+02FF):˯ ˰ ˱ ˲ ˳ ˴ ˵ ˶ ˷ ˸ ˹ ˺ ˻ ˼ ˽ ˾ ˿
佔位修飾符號 Spacing Modifier Letters[1] Unicode Consortium 官方碼表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+02Bx | ʰ | ʱ | ʲ | ʳ | ʴ | ʵ | ʶ | ʷ | ʸ | ʹ | ʺ | ʻ | ʼ | ʽ | ʾ | ʿ |
U+02Cx | ˀ | ˁ | ˂ | ˃ | ˄ | ˅ | ˆ | ˇ | ˈ | ˉ | ˊ | ˋ | ˌ | ˍ | ˎ | ˏ |
U+02Dx | ː | ˑ | ˒ | ˓ | ˔ | ˕ | ˖ | ˗ | ˘ | ˙ | ˚ | ˛ | ˜ | ˝ | ˞ | ˟ |
U+02Ex | ˠ | ˡ | ˢ | ˣ | ˤ | ˥ | ˦ | ˧ | ˨ | ˩ | ˪ | ˫ | ˬ | ˭ | ˮ | ˯ |
U+02Fx | ˰ | ˱ | ˲ | ˳ | ˴ | ˵ | ˶ | ˷ | ˸ | ˹ | ˺ | ˻ | ˼ | ˽ | ˾ | ˿ |
註釋
|
音标扩展(U+1D00–1D7F)
[编辑]这个区段和下面的音标扩展增补包括了:
- 小型大写字母“ɢ ɪ ɴ ɶ ʀ ʏ ʙ ʜ ʟ”
- 倒转的小写字母“ɐ ɥ ɯ ɹ ɺ ɻ ʇ ʌ ʍ ʎ ʞ ʮ ʯ”
- 额外的小型大写字母“ʁ ʛ ᴀ ᴁ ᴃ ᴄ ᴅ ᴆ ᴇ ᴊ ᴋ ᴌ ᴍ ᴎ ᴏ ᴐ ᴘ ᴙ ᴚ ᴛ ᴜ ᴠ ᴡ ᴢ ᴣ ᴦ ᴧ ᴨ ᴩ ᴪ”
- 带硬腭音钩的小写字母“ƫ ᶀ ᶁ ᶂ ᶃ ᶄ ᶅ ᶆ ᶇ ᶈ ᶉ ᶊ ᶋ ᶌ ᶍ ᶎ ᶪ ᶵ”
- 带卷舌钩的小写字母“ᶏ ᶐ ᶒ ᶓ ᶔ ᶕ ᶖ ᶗ ᶘ ᶙ ᶚ ᶩ ᶯ ᶼ”
音標擴展 Phonetic Extensions[1] Unicode Consortium 官方碼表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1D0x | ᴀ | ᴁ | ᴂ | ᴃ | ᴄ | ᴅ | ᴆ | ᴇ | ᴈ | ᴉ | ᴊ | ᴋ | ᴌ | ᴍ | ᴎ | ᴏ |
U+1D1x | ᴐ | ᴑ | ᴒ | ᴓ | ᴔ | ᴕ | ᴖ | ᴗ | ᴘ | ᴙ | ᴚ | ᴛ | ᴜ | ᴝ | ᴞ | ᴟ |
U+1D2x | ᴠ | ᴡ | ᴢ | ᴣ | ᴤ | ᴥ | ᴦ | ᴧ | ᴨ | ᴩ | ᴪ | ᴫ | ᴬ | ᴭ | ᴮ | ᴯ |
U+1D3x | ᴰ | ᴱ | ᴲ | ᴳ | ᴴ | ᴵ | ᴶ | ᴷ | ᴸ | ᴹ | ᴺ | ᴻ | ᴼ | ᴽ | ᴾ | ᴿ |
U+1D4x | ᵀ | ᵁ | ᵂ | ᵃ | ᵄ | ᵅ | ᵆ | ᵇ | ᵈ | ᵉ | ᵊ | ᵋ | ᵌ | ᵍ | ᵎ | ᵏ |
U+1D5x | ᵐ | ᵑ | ᵒ | ᵓ | ᵔ | ᵕ | ᵖ | ᵗ | ᵘ | ᵙ | ᵚ | ᵛ | ᵜ | ᵝ | ᵞ | ᵟ |
U+1D6x | ᵠ | ᵡ | ᵢ | ᵣ | ᵤ | ᵥ | ᵦ | ᵧ | ᵨ | ᵩ | ᵪ | ᵫ | ᵬ | ᵭ | ᵮ | ᵯ |
U+1D7x | ᵰ | ᵱ | ᵲ | ᵳ | ᵴ | ᵵ | ᵶ | ᵷ | ᵸ | ᵹ | ᵺ | ᵻ | ᵼ | ᵽ | ᵾ | ᵿ |
註釋
|
音标扩展增补(U+1D80–1DBF)
[编辑]音標擴展補充 Phonetic Extensions Supplement[1] Unicode Consortium 官方碼表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1D8x | ᶀ | ᶁ | ᶂ | ᶃ | ᶄ | ᶅ | ᶆ | ᶇ | ᶈ | ᶉ | ᶊ | ᶋ | ᶌ | ᶍ | ᶎ | ᶏ |
U+1D9x | ᶐ | ᶑ | ᶒ | ᶓ | ᶔ | ᶕ | ᶖ | ᶗ | ᶘ | ᶙ | ᶚ | ᶛ | ᶜ | ᶝ | ᶞ | ᶟ |
U+1DAx | ᶠ | ᶡ | ᶢ | ᶣ | ᶤ | ᶥ | ᶦ | ᶧ | ᶨ | ᶩ | ᶪ | ᶫ | ᶬ | ᶭ | ᶮ | ᶯ |
U+1DBx | ᶰ | ᶱ | ᶲ | ᶳ | ᶴ | ᶵ | ᶶ | ᶷ | ᶸ | ᶹ | ᶺ | ᶻ | ᶼ | ᶽ | ᶾ | ᶿ |
注釋
|
声调修饰符号(U+A700–A71F)
[编辑]- U+A700到U+A707的8个符号不是标准的国际音标符号。它们只是在早期被用于标示汉语的声调调类(不是调值,平上去入、各分阴阳,所以一共8个符号),标准国际音标规范中没有这8个符号。
- U+A717到U+A71A不是标准的国际音标符号,它们用于记录奇南特克语的声调符号。
- U+A71B到U+A71F不是标准的国际音标符号,它们用于记录非洲语言的声调
聲調修飾符號 Modifier Tone Letters[1] Unicode Consortium 官方碼表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+A70x | ꜀ | ꜁ | ꜂ | ꜃ | ꜄ | ꜅ | ꜆ | ꜇ | ꜈ | ꜉ | ꜊ | ꜋ | ꜌ | ꜍ | ꜎ | ꜏ |
U+A71x | ꜐ | ꜑ | ꜒ | ꜓ | ꜔ | ꜕ | ꜖ | ꜗ | ꜘ | ꜙ | ꜚ | ꜛ | ꜜ | ꜝ | ꜞ | ꜟ |
註釋
|
上标和下标(U+2070–209F)
[编辑]上標和下標 Superscripts and Subscripts[1][2][3] Unicode Consortium 官方碼表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+207x | ⁰ | ⁱ | ⁴ | ⁵ | ⁶ | ⁷ | ⁸ | ⁹ | ⁺ | ⁻ | ⁼ | ⁽ | ⁾ | ⁿ | ||
U+208x | ₀ | ₁ | ₂ | ₃ | ₄ | ₅ | ₆ | ₇ | ₈ | ₉ | ₊ | ₋ | ₌ | ₍ | ₎ | |
U+209x | ₐ | ₑ | ₒ | ₓ | ₔ | ₕ | ₖ | ₗ | ₘ | ₙ | ₚ | ₛ | ₜ | |||
註釋 |
参见
[编辑]参考资料
[编辑]外部链接
[编辑]- http://unicode.org/charts/#PhoneticSymbols (页面存档备份,存于互联网档案馆) links to PDFs of Unicode codes for several phonetic symbol sets.
- PhoTransEdit (页面存档备份,存于互联网档案馆) This free software tool translates English texts into IPA phonetics and also exports transcriptions to HTML decimal code numbers.
- Spacing Modifier Letters (页面存档备份,存于互联网档案馆) (everything2.com)