本頁使用了標題或全文手工轉換

TeX

維基百科,自由的百科全書
前往: 導覽搜尋
TeX
TeX logo
開發者 高德納
穩定版本 3.14159265(2014年1月,​3年前​(2014-01
作業系統 跨平台
類型 排版
許可協定 Permissive
網站 http://www.tug.org/
原始碼庫 www.tug.org/svn/texlive/trunk/

TeX希臘語/tɛx/[1],音譯「泰赫」,文字模式下寫作TeX),是一個由美國電腦教授高德納Donald Ervin Knuth)編寫的功能強大的排版軟體。它在學術界十分流行,特別是數學物理學電腦科學界。TeX被普遍認為是一個優秀的排版工具,特別是在處理複雜的數學公式時。利用諸如是LaTeX等終端軟體,TeX就能夠排版出精美的文字以幫助人們辨認和尋找。

TeX的MIME類型application/x-tex。TeX是自由軟體

歷史[編輯]

高德納(Donald Knuth,1938/01/10 -)最早開始自行編寫TeX的原因,是因為當時的排版技術十分粗糙,已經影響到他的巨著《電腦程式設計藝術》的印刷品質。他以典型的駭客思維模式,決定自行編寫一個排版軟體:TeX。他原本以為他只需要半年時間,在1978年下半年就能完成,但最終他用了超過十年時間,直到1989年TeX才最終停止修改。

蓋伊·史提爾二世在高德納編寫其第一版的TeX程式時,正好在高德納所工作的史丹福大學,當他回到麻省理工學院(MIT)時他在ITS英語Incompatible Timesharing System下重寫了TeX的輸出輸入系統。

TeX的第一版是用SAIL程式語言英語SAIL programming language寫成的,執行於PDP-10型電腦英語PDP-10,採用史丹福大學的WAITS英語WAITS作業系統。在之後的TeX版本中,高德納(Knuth)發明了所謂的「文學編程」(literate programming),一種從同一原始檔自動生成可編譯的原始碼和高品質的文件的編程方法。這種語言被稱為WEB,它所生成的原始碼是使用Pascal程式語言

TeX的版本號碼也十分有趣。從TeX第三版開始,之後的升級是在小數點後加入一個新數位,使之越來越接近圓周率π」的值。TeX目前的版本是3.14159265。這顯示了TeX已經十分穩定,任何的升級都十分細微。高德納曾表示「最後一次升級是(於我過世後)將版本數改為『π』,那時任何餘下的漏洞將被看作程式的功能。」

TeX允許自由的再發布及修改,但禁止任何修改版本以TeX或任何其他相似的名字命名。

特性[編輯]

TeX軟體在當時擁有其他排版軟體沒有或不成熟的功能。其中有一些功能得益於排版演算法的創新,其中很多成為了高德納的學生的論文主題。儘管有些功能現在已經被其他排版系統所實現,但仍有部分功能是TeX所特有的,比如數學公式的自動間距調整。

數學公式的自動間距調整[編輯]

Mathematical text typeset using TeX and the AMS Euler font

由於TeX的設計目標是實現高品質的書籍排版,高德納在數學公式的排版上下了很大功夫。[2][3] 他研究了三種按照老方法排版、排版品質高的書籍:艾迪生韋斯利出版社(即高德納的《電腦程式設計藝術》的出版商)的出版物,尤其是漢斯·沃爾夫和約瑟夫·拉格朗日的書籍(thermodynamics innovation, +1856)、數學期刊《Acta Mathematica》、和數學期刊《Indagationes Mathematicae》。高德納通過研究其數學公式的排版,總結出了一套數學公式內部間距的規則,並將其用於TeX。[4]TeX排版數學公式時只是提供了一個間距調整引擎,實際的間距大小由數學字型提供。比如TeX預設的Computer Modern字型提供了一套成熟的間距參數,可以直接使用。

TeX的數學排版功能並非十全十美,有時也招來部分批評。比如TeX誕生的時代的部分機器由於容量不夠,不足以儲存TeX的所有字型參數,在部分場合需要hack才能正常使用。在美學方面,TeX對根號的處理也招致批評。[5]

OpenType字型技術的數學字型參數基於TeX。[6][7][8]

斷行[編輯]

與手動排版相比,電腦排版系統可以自動處理斷行問題。大部分排版系統都採用首次擬合法處理斷行,即一行一行處理,一行處理完就不管了。TeX的方法是一次處理一個自然段,嘗試每一種斷行方法,然後選出最優解。兩種方法的差異如下:

(此演示不考虑断字)
  The quick brown fox jumps over          The  quick  brown  fox   jumps
the lazy dog. The words here are        over  the  lazy  dog.  The words
quite  short.  Aren't they?  But        here  are  quite  short.  Aren't
long     ones      such       as        they?  But  long  ones  such  as
perhydrocyclopentanophenanthrene        perhydrocyclopentanophenanthrene
may appear.                             may appear.

左邊的例子是首次擬合法的結果。第4行單詞間的空集中在一處不美觀,TeX的方法由於考慮了所有的情況,所以一般情況下能找出較好的方法(即把空分散在1~4段)。TeX的斷行演算法里有一個叫做badness(「不美觀度」)的參數,空格伸縮量越大badness越大。每一種斷行的方式都有一個總體的衡量標準,包括badness、斷行、以及行與行之間的疏密差異等。TeX其實並不考慮所有的2n種情況,而是採用一種演算法複雜度僅為O(n2)的最短路徑演算法,加上不考慮空格伸縮量太大的情況,斷行所用的時間幾乎和段落大小成正比。在分頁問題上,TeX並不採用一種考慮所有情況,得出最優解的演算法,而是用一頁一頁處理的方法,因為一是分頁的靈活性沒有斷行那樣高,二是當時的電腦沒有足夠的速度。但是,TeX仍然有避免寡行和孤行的功能。Michael Plass的一篇論文指出,考慮到圖表的放置位置的完美分頁演算法可能為NP完全

TeX的斷行演算法後來被Adobe InDesign桌面出版軟體所採用。

在斷行時,如果一遍不成功,TeX會嘗試斷字,即把一個諸如「computer」的多音節單詞斷成「com-」和「puter」或「compu-」和「ter」分在兩行。TeX82採用了一套Frank Liang於1983年發明的斷字演算法。這套演算法採用「符合項」的方法。「符合項」的作用是找到單詞中可能出現的一些字母組合,然後在適當的位置插入數字來表示可能/不可能的斷字點。這些「符合項」對單詞的字母與字母之間會給予是否為斷字點提示。提示有相對的強弱。如果提示互相衝突,則強的會覆蓋弱的。最後留下來的提示決定一處是否為斷行點。TeX內建4447條「符合項」,從.ach4開始到z4zy結束。所有「符合項」使用1到5這5個數字,其中奇數表示可能為可斷字點,偶數表示不為可斷字點,大的數字的話語權強於小的數字。例如,h5elo的含義是,單詞中如果出現「helo」,那麼在「h」和「e」之間有很大把握為可斷行點(例如「bach-e-lor」和「ech-e-lon」);hach4的含義是,單詞中如果有「hach」,則「h」後面很可能不是斷字點(如「tooth-aches」),雖然把握沒有數字5的那麼大。例如,對於單詞「encyclopedia」,對得上的符合項有1c4l4, 1cy, 1d4i3a, 4edi, e3dia, 2i1a, ope5d, 2p2ed, 3pedi, pedia4, y1c。插入完所有數字後,留下來的數字中的最大值為en1cy1c4l4o3p4e5d4i3a4,最後奇數處為可斷行點:「en-cy-clo-pe-di-a」。

這種方法可以找到約90%的正確斷字點,幾乎從不出錯。而且,TeX有一個「斷字特例表」的功能,對於內建斷字演算法出錯的單詞可以手動處理。TUG(TeX用戶組)有一份英語單詞的特例表。另外,TeX預設不會把單詞在前兩個字母或後三個字母之間斷開,所以encyclopedia一詞不會斷成「encyclopedi-」和「a」(這樣不好看)。

品質[編輯]

TeX是非常穩定的程式,高德納懸賞獎勵任何能夠在TeX中發現程式漏洞(bug)的人。每一個漏洞的獎勵金額從128美分開始,以後每發現一個bug,都會翻倍,直到目前的327.68美元封頂。然而高德納從未因此而損失大筆金錢,因為TeX中的漏洞極少,而真正發現漏洞的人在獲得支票後往往不願將其兌現。[9][10] [11] 到目前為止,關於TeX的最後一個bug是被Oleg Bulatov發現的。

名字[編輯]

TeX這個詞的標準發音為/tɛx/,其中/x/相當於普通話「赫」字的聲母,或者蘇格蘭語[需要消歧義]「loch」一詞中「ch」的發音(X其實是希臘字母 χ)。音譯「泰赫」。在英語法語中實際通常讀作/tɛk/,音譯「泰克」。TeX這個詞來自希臘文中的 τέχνη (TEXNH),希臘文意為「藝術」和「製造」,也是英語中 technical(技術)的詞源。書寫時,三個字母都是大寫,字母E應當低於其他兩個字母。而不支援下標的系統則只能這樣書寫:「TeX」。

TeX的用戶喜歡創造一些和TeX有關的詞彙,例如TeXnician(與英語單詞technician,技工的發音相近,意為TeX用戶),TeXhacker(TeX程式設計師,TeX駭客)和TeXnique(與英語單詞technique,技巧的發音相近,意為TeX的使用技巧)等。另有人發明一詞為TeXpert(TeX高手),但是高德納本人反對這一名稱,因為這裡TeX一詞的讀法是錯誤的[12]

衍生軟體[編輯]

有許多衍生出來的文件處理程式就是基於TeX的,主要的有:

相容工具[編輯]

TeXmacs是一個所見即所得的科學文件編輯器,利用TeX字型作為顯示字型,具有類似Emacs的編輯方式。它可以匯出為TeX文字,PSPDF文件,以及HTMLXML頁面。LyX也是一個類似的工具。

範例[編輯]

此乃一簡易的TeX文字範例。 首先建立一名為myfile.tex的純文字,並載有以下內容:

hello
\bye

然後啟用命令列直譯器(Command line interpreter,如MS-DOS),輸入:

tex myfile.tex

之後TeX便會建立一名為myfile.dvi的檔案。此檔可用如Yap之類的檢視器檢視。此檔於檢視器可見的是「hello」一詞。「\bye」是一個TeX指令,相等於檔案結束標記,是不會顯示出來的。此DVI檔可在檢視器中直接列印或轉換成更普遍的格式,例如PostScript

另外,使用以下指令亦能輸出PDF檔。

pdftex myfile.tex

當初創造pdfTeX是因為把DVI轉成PostScript再轉成PDF所產生的字型顯示質素很差(但列印則沒問題)。這是由於TeX本身支援點陣字型(Type 3),而此遠不及向量字型(Type 1)的顯示質素好。

數學公式範例[編輯]

二次方程為例,以下的輸入

 Quadratic formula is ${-b\pm\sqrt{b^2-4ac} \over {2a}}$
 \bye

會產生如下輸出:

所有方程式在TeX中都是以一對$符號括住。如果要使公式放在新行置中,那麼就以$$取代$。例如:

 Quadratic formula is $${-b\pm\sqrt{b^2-4ac} \over {2a}}$$
 \bye

輸出結果:

LaTeX[編輯]

LaTeX是一套以TeX描述的巨集軟體。LaTeX有很多預設的模版、樣式。它比TeX更為結構化,如包含了供建立索引表格列表等的巨集和公用軟體。例如:

\documentclass[a4paper]{book}
\begin{document}
\section{ ... a title }
\subsection{ ... a subtitle}
%% Text goes here
\end{document}

執行

latex myfile.tex
dvips myfile.dvi

會建立一本為PostScript檔的書。如要建立PDF檔則可使用

pdflatex myfile.tex

註腳[編輯]

  1. ^ 國際音標的/x/讀似「喝」音
  2. ^ Slater, Robert, Portraits in Silicon, MIT Press: 349, 1989, ISBN 9780262691314 
  3. ^ Syropoulos, Apostolos; Tsolomitis, Antonis; Sofroniou, Nick, Digital Typography Using LaTeX, Springer: 93, 2003, ISBN 9780387952178 
  4. ^ Donald E. Knuth. Questions and Answers II, TUGboat 17 (1996), p. 355–367. Reprinted as chapter 32 of Digital Typography, p. 620–624.
  5. ^ Ulrik Vieth (2001) Math typesetting in TEX: The good, the bad, the ugly
  6. ^ High-Quality Editing and Display of Mathematical Text in Office 2007. 
  7. ^ LineServices. 
  8. ^ http://www.ntg.nl/maps/38/03.pdf
  9. ^ Kara Platoni, Love at First Byte. Stanford Magazine, May–June 2006
  10. ^ The History of TeX
  11. ^ TeX — Beauty and Fun, http://www.ctex.org/documents/shredder/tex_frame.html
  12. ^ Knuth, Donald Ervin. The TeXbook. Addison-Wesley. 1993. ISBN 0-201-13448-9. 

參見[編輯]

外部連結[編輯]

參考文獻[編輯]

  • Donald Knuth: The TeX book, Massachusetts: Addison-Wesley, 1984