合字
合字、連字、連結字或合體字(英语:Ligature),在西方字体排印学中一般表示將多於一個字母的合成一個字形。如印刷品中常常将拉丁字母两个字母fi的i上一點常與f的一橫合併,而德語字母 ß原為ss等等。 合字經過演變、長時間流行後,可能被視為直接的符號、文字而非合字。如W源自VV或UU,Æ源自AE,而表示「與」的意思的「&」,原是e和t的合字。
目录 |
历史 [编辑]
印刷合字单纯源于手写本中连写的字符。以发现的最早的楔形文字手写本中就已经含有很多连写字符。中世纪的拉丁文手写本中,誊写僧人为加快速度将字符连写,诞生了很多手写缩合字,如在哥特体中,带右圈的字母(b, o, 和 p)和带左圈的字母(c, e, o, d, g 和 q)的圈部都被重叠书写。很多手写本字符如h, m和n的竖划都被重叠,而且诞生了很多手写缩合字。14世纪的手写本中含有很多这种手写缩合字。
当活字印刷诞生后,很多合字直接被制造成了铅字。但是在1950年代无衬线字体广泛使用,以及1970年代照相排版技术之后,合字就逐渐很少被使用。最早能进行合字电脑排版(之后激光打印机)之一的是 高德納的TeX 程序(详见下文)。这一潮流也影响到了1985年之后的桌面排版 技术。早期电脑软件无法进行合字替换(但TeX可以),大部分新制作的电脑字体裡也没有合字。早期的个人电脑多使用英文,而英文中并不是必须使用合字,所以也没有实际需要。
随着现代电脑处理的多语言化和现代电子排版技术(如OpenType),合字开始逐渐恢复被使用。
拉丁文字 [编辑]
书法合字 [编辑]
许多合字都把字母f和其后的字符组合起来,最常用的就是fi (或 fi,显示为两个独立字符)。很多字体的这两个字母并排在一起后,字母i上的点会抵挡到字母f的弧形勾,无法正确排印,所以干脆就制造一个合字铅字,把 i 的点融入 f 的勾来直接使用。其他 f 合字包括 fj,[1] fl (fl), ff (ff), ffi (ffi), 和 ffl (ffl)。其他合字包括fa, fe, fo, fr, fs, ft, fb, fh, fu, fy,以及f 后加句号、 逗号或连字符,还有不太常用的双写ff和 fft 。
使用这些合字是因为通常的 小写字母 f中弧形勾影响字符间距调整。
有时,跨词合字 (如 shelfful[2]的'ff')是不希望出现的,电脑程序 (如TeX)提供手动方式将它们分开。 一些字体带有 fff合字 (如Requiem体甚至包括一个 fffl 合字)用于德语的复合词,如 Sauerstoffflasche ("氧气罐") 和 Schifffahrt ("游艇") (仅在遵循1996年拼写改革法的前提下才写作 fff)。正式的德文正字法,如 Duden所述,不赞成跨词合字,由于fff组合在德文中只会在组合词出现如(Schiff-fahrt,Sauerstoff-flasche),所以这样跨词合字在德文中使用会被认为是不正确的[3]
土耳其语中有带点和不带点的字母I,如单词 fırın ("烤箱") 和 fikir ("主意")。 fi合字容易混淆,所以在土耳其文排印中一般不使用该合字。像 fl合字一般也不用,土耳其语本来就没有这样的拼写。
合字"ſʒ ("sz")和tʒ ("tz") 来自德语哥特体,现在街头、城市广场的标识中带Platz或者以-platz结尾时仍常被使用。
有时 st (st) ſt (ſt), ch, ct以及Qu的合字也被使用(如字体Linux Libertine).
德文 ß [编辑]
德语中 esszett合字(亦称scharfes s「尖銳S」)ß,源自「長S在圓S之上」或「长 s 加 z」。尽管「长s」ſ 已经在现代德文正字法消失了, ß 仍被保留并被视为合字,在大写的时候以及字母排序的时候改写为「SS」。ß 仅在德国和奥地利使用,瑞士德文不用这个合字。
起源于合字的字母 [编辑]
字母W是7世纪左右才被加入拉丁字母表的,其发音不尽相同。古英语使用盧恩字母Wynn (Ƿ) ,但受到諾曼人影響後废弃不用。14世纪,这个起源于双写的V或U的"新"字母W诞生并在字母表中占有一席。由于它相对于其他字母比较年轻,只有很少欧洲语言(英语、荷兰语、德语、波兰语、威尔士语、馬耳他語和瓦龍語)使用它来拼写本土词汇。
字符Æ(小寫æ,中世紀時稱為aesc)作为一个字符在丹麥語、挪威语、冰岛语以及古英语中使用,并不是一个印刷用的合字。它是一个实在的字母——代表一个元音,且在字母表中有位置。现代英文正字法中Æ不作为一个单独字母,而只是一种拼写异形,如百科全书的英文单词encyclopædia也可拼写成encyclopaedia或encyclopedia。
Æ源自中世纪拉丁文,当时只是一些词汇的随意合字如 "Æneas"。它还可以在英文和法文中出现,但是现在已经倾向把 A和E分開印刷。[4] 同样,Œ 和œ在法文中虽然通常印刷成合字,但在技术限制情况下仍可以拆开书写。
在德文正字法中,带两点的字母元音ä, ö和ü來自历史上的ae, oe, ue 合字(严格的说是上標的e,即aͤ,oͤ,uͤ)。现在当文字处理无法显示这三个字符的情况下仍可改写为二合字母ae, oe, ue。字母排序中它们不等价于ae, oe, ue,而是被简单看成 a, o, u。而北欧语言则不同:带两点的字母被视为独立字母,并排在字母表最后。
一些元音中的圈形附加符号,如 å起源于一个o合字[5]。现在把旧式 aa 改写为 å 已经称为不成文习惯,但在此之前也可写成 a 上再加一个小 a(aͣ),如 Johannes Bureus, Runa ABC boken [6]。
uo 合字 ů 的使用实例也在早期现代高地德语裡找到,但其后来混同到u中(如中期高地德语的fuosz、 早期现代高地德语 fuͦß、现代德语 Fuß)。它仍存在于捷克语中,被称为kroužek。
西班牙语和葡萄牙语中的上波浪线,分別用於字母ñ和表示元音鼻音化,起源于一个nn合字[7](Espanna = España, anno = año)。同样法语中的抑揚符也源自不发音s。[8] 法语、葡萄牙语、西班牙语等中的字母ç其实是一个字母 "c" 盖在一个"z"上面的形式。
字母hwair(Hwair)仅用于转写哥德語,代表hw合字。最早在1900年左右心理学者使用这个字用于代替二合字母 hv 用于表示有问题的现象,如Jacques Paul Migne在其1860年代的著作 (Patrologia Latina,第18卷).
拜占庭帝国有一个独特的合字o-u ligature (Ȣ) ,它源于希腊字母的 ο-υ 两个字母的合字,并被加入到了字母表中。
Gha(Gha)是一个罕见的字母,起源于 Q 和 G,但在ISO的文件中误注成 O-I 合字 (参见Unicode注解)
国际音标使用合字来表示塞擦音,其中6个有Unicode编码: ʣ、ʤ、ʥ、ʦ、ʧ、ʨ。一个擦音仍使用合字:ɮ,而国际音标扩展裡加入了后三个:ʩ、ʪ、ʫ。
还有一些罕见合字,如 Ꜳꜳ、Ꜵꜵ、Ꜷꜷ、Ꜹꜹ、Ꜻꜻ、Ꜽꜽ、Ꝏꝏ、ᵫ、ᵺ、Ỻỻ、Ꜩꜩ、ᴂ、ᴔ。
起源于合字的符号 [编辑]
最常用的合字符号当属 &。它起源于E 和t的合字,即拉丁文的单词“和”(et)。它在法文中保持原音原意而在英文中也使用。由于其使用广泛,一般已经不认为它是一个合字而是一个普通符号。
和其他合字一样,它被仍当作一个字母来使用(如早期现代英语),英语中它念作"and"而不是"et",而&c念作 "et cetera"(等等)。大多数字体中的字形和两字直接组合不一样,但仍有一些字体(如Trebuchet MS)就把他们设计 & 为合字。
同样,美元符号$可能也起源于合字(“pesos”,但有也有其他不同说法),但现在实际上已经被当成一个普通符号。[9] 西班牙比塞塔(peseta)也有时被写作合字 ₧ (源自 Pts).
二合字母 [编辑]
二合字母,如西班牙语和威尔士语中的 ll,一般不被看成是合字,因为印刷上两个字母通常是分开的。正如上讨论的合字一样,一些二合字母在一些语言中有不同处理方式。西班牙1994年拼写改革时,二合字母ch 和 ll 已经被考虑为分开的两个字母。
尽管如此,荷兰语中 "ij"的定位比较模糊。根据不同的使用标准,它可看成是一个二合字母,或合字,或者一个独立字母。它有独立的大小写形式,而在一些专业字体中,通常是有一个独立字形也有合字 (如 Zapfino)。无衬线字体 大写字母的IJ流行于荷兰,通常形状像是一个断左臂的U。更令人混淆的是,手写时可以把小写字母y写作没有点的 ij,和大写字母IJ (同样没有点)看起来只是大小差异而已。而 Y在本土荷兰语词汇中不被使用。
含有合字的拉丁语文 [编辑]
非拉丁字符 [编辑]
合字不仅出现在拉丁文本中:
- 婆罗米系文字的元音附标文字频繁使用合字标注辅音。合字的数量依据语言而不同,如同样的天城文,用于 梵文的合字就要比印地文多。总数为37的辅音中,在天城文两个字母组成的合字总数为1369,很少字体能全部显示这些合字。微软Windows系统附带的''Mangal.ttf''字体带有印地语支持,但不能正确处理在द, ट, ठ, ड, 和 ढ右边的辅音合字, 而只是加 virama后按照一般形式显示在辅音之后。
- 希腊字母中使用一些合字,特别是在Ο(Omicron)和Υ(Upsilon)连写并衍生出一个西里尔字母。参见Ou字母。
- 西里尔合字:Љ、Њ、Ы、Ѿ。Iotified 西里尔字母是早期西里尔illic decimal I和其他元音的合字:Ꙗ(Я的前身)、Ѥ、Ѩ、Ѭ、Ю(源自另外一个合字,Оу,早期的У形式)。马其顿和塞尔维亚字母表中的两个字母 lje 和 nje(љ, њ)在19世纪曾分别是El En(л, н)与 软音符(ь)的合字。还有一个ya(Я)和 e 的合字:{{sans-serif|Ԙԙ,其他合字包括 Ꚅꚅ 和 Ꚉꚉ。
- 格拉哥里字母的一些手写形式:用于中世纪到19世纪书写 Slavic 语言,多为方形且常用合字。
- 在希伯来语中字母aleph 和 lamed 在一些前现代文本中(主要是宗教或“犹太-阿拉伯”文本)可组合为合字。该组合很常用,因为 [ʔ][a]l- (在希伯来文中写作 aleph加lamed)是阿拉伯语中的定冠词。
- 阿拉伯文:各个字母在词头,词中,词尾均有不同形式。如阿拉伯文的mīm,单独书写为 م,三个连写 (mmm,显示为词头,词中,词尾形)就变为 ممم 。注意 lām + ʼalif 的情况是特殊的: ﻻ, 而 lām + ʼalif 词中,词尾形是ﻼ。在Unicode有一个特殊的 安拉 合字位于U+FDF2: ﷲ.
- 乌尔都语 使用阿拉伯字母的手写体 (Nasta`līq Script) ,在电子排印中有大量合字。乌尔都语最常用的排版工具 InPage使用 Nasta`līq Script字体多达 20,000个合字。
- 漢字中如孔孟好學、招財進寶、日进斗金、双喜一般也合为一字书写,称为合文,另外还有大量叠字流传至今。也有网民将“草泥马”编成合文。
|
招財進寶的合書
|
草泥马的合書
|
孔孟好學的合書
|
电脑排版 [编辑]
TeX是电脑排版系统中能使用合字的典型程序。 它能提供五个常用合字: ff、fi、fl、ffi 和 ffl。当TeX遇到这些组合时会自动替换成合字。当然操作者可以手动切换。
OpenType字体格式可以针对一个字符提供多个字形,因此用来作为合字替换,但需要软件支持。XeTeX就是一个可以调用TeX的排版引擎。这种替换原先主要用于阿拉伯文排版,但现在已经广泛用于西文。
下表列出了常用文字对的合字以及Unicode代码。正确显示需要使用能正确处理合字的操作系统和浏览器 并调用正确的Unicode 电脑字体。
Unicode中对合字的处理不是一种字符定义,而是一种表现形式。比如,如果一个现代字体需要显示'h'后加 'r',且该字体确实有'hr'合字,这个合字才会被显示出来。因此,使用特殊Unicode合字字符是"不鼓励"且"在任何环境下不会被再度编码"。[10] 注意,合字 æ 和 œ 不能随意替代 'ae' 和 'oe',比如 'does'不能写作 'dœs'。
Unicode中的合字 [编辑]
- 这是一个不完整列表。U+A732到U+A73D 区域及其临近区域的一些字符没有列出。
-
非合字 合字 Unicode Et & U+0026 ſs, ſz ß U+00DF AE, ae Æ, æ U+00C6, U+00E6 OE, oe Œ, œ U+0152, U+0153 IJ, ij IJ, ij U+0132, U+0133 ue ᵫ U+1D6B ff ff U+FB00 fi fi U+FB01 fl fl U+FB02 ffi ffi U+FB03 ffl ffl U+FB04 ſt ſt U+FB05 st st U+FB06
另外,Dz、 克罗地亚语和波斯尼亚语字母 DŽ, LJ, 和 NJ都有单独的码位。它们不是合字而是二合字母。 仅在语音转写中使用的合字
-
Non-ligature Ligature Unicode db ȸ U+0238 qp (cp) ȹ U+0239 dz ʣ U+02A3 dʑ (or dz curl) ʥ U+02A5 dʒ (or dezh) ʤ U+02A4 fŋ ʩ U+02A9 ls ʪ U+02AA lz ʫ U+02AB lʒ (or lezh) ɮ U+026E tɕ (or tc curl) ʨ U+02A8 ts ʦ U+02A6 tʃ (or tesh) ʧ U+02A7
U+0238 和 U+0239 是二合字母,但实际上是合字。[11]
注释 [编辑]
- ^ 字母组合 fj 在英语中仅有"fjord" 和 "fjeld"中出现,但加上世界语, 挪威语和其他 j代表半元音的语言
- ^ Helmut Kopka; Patrick W. Daly. A Guide to LaTeX, 3rd Ed.. Addison-Wesley. 1999: 22. ISBN 0201398257.
- ^ Duden 1, Mannheim 1996, p. 69.
- ^ The Chicago Manual of Style, 14th Ed. Chicago: The University of Chicago Press. 1993: 6.61.
- ^ [1]
- ^ [2]
- ^ AulaHispanica.com
- ^ Teach Yourself French. Collier's Cyclopedia, 1901.
- ^ Cajori, Florian. A History of Mathematical Notations. New York: Dover (reprint). 1993. ISBN 0-486-67766-4. - contains section on the history of the dollar sign, with much documentary evidence supporting the theory $ began as a ligature for "pesos".
- ^ Ligatures, Digraphs and Presentation Forms, Unicode FAQ
- ^ Freytag, Asmus; McGowan, Rick; Whistler, Ken. Known Anomalies in Unicode Character Names. Unicode Technical Note #27. Unicode Inc. 2006-05-08 [2009-05-29].
相關項目 [编辑]
外部連結 [编辑]
| 维基共享资源中相关的多媒体资源:合字 |
|
||||||||||||||||||||||||||||||||||||||||||
