本頁使用了標題或全文手工轉換

LLVM

維基百科,自由的百科全書
跳至導覽 跳至搜尋
LLVM
LLVM Logo.svg
開發者LLVM開發團隊
初始版本2003
穩定版本
10.0.0
(2020年3月24日,​4個月前​(2020-03-24
原始碼庫 編輯維基數據鏈接
程式語言C++
作業系統跨平台
類型編譯器
授權條款伊利諾伊大學厄巴納-香檳分校開原始碼許可(University of Illinois/NCSA Open Source License)
帶有LLVM例外的Apache授權條款2.0(9.0.0或更新)
網站llvm.org

LLVM是一個自由軟體專案,它是一種編譯器基礎設施,以C++寫成,包含一系列模組化的編譯器組件和工具鏈,用來開發編譯器前端後端。它是為了任意一種程式語言而寫成的程式,利用虛擬技術創造出編譯時期鏈結時期執行時期以及「閒置時期」的最佳化。它最早以C/C++為實作物件,而目前它已支援包括ActionScriptAdaD語言FortranGLSLHaskellJava位元組碼、Objective-CSwiftPythonRubyCrystalRustScala[1]以及C#[2]等語言。

LLVM專案的發展起源於2000年伊利諾伊大學厄巴納-香檳分校維克拉姆·艾夫(Vikram Adve)與克里斯·拉特納(Chris Lattner)的研究,他們想要為所有靜態及動態語言創造出動態的編譯技術。LLVM是以BSD授權來發展的開源軟體。2005年,蘋果電腦雇用了克里斯·拉特納及他的團隊為蘋果電腦開發應用程式系統[3],LLVM為現今Mac OS XiOS開發工具的一部分。

LLVM的命名最早源自於底層虛擬機器Low Level Virtual Machine)的首字母縮寫[4],由於這個專案的範圍並不侷限於建立一個虛擬機器,這個縮寫導致了廣泛的疑惑。LLVM開始成長之後,成為眾多編譯工具及低階工具技術的統稱,使得這個名字變得更不貼切,開發者因而決定放棄這個縮寫的意涵[5],現今LLVM已單純成為一個品牌,適用於LLVM下的所有專案,包含LLVM中介碼(LLVM IR)、LLVM除錯工具、LLVM C++標準函式庫等。

因LLVM對產業的貢獻,電腦協會於2012年將ACM軟體系統獎授與維克拉姆·艾夫、克里斯·拉特納及Evan Cheng[6]

描述[編輯]

LLVM提供了完整編譯系統的中間層,它會將中間語言Intermediate Representation,IR)從編譯器取出與最佳化,最佳化後的IR接著被轉換及鏈結到目標平台的組合語言。LLVM可以接受來自GCC工具鏈所編譯的IR,包含它底下現存的編譯器。

LLVM也可以在編譯時期、鏈結時期,甚至是執行時期產生可重新定位的程式碼(Relocatable Code)。

LLVM支援與語言無關的指令集架構類型系統[7]。每個在靜態單賦值形式(SSA)的指令集代表著,每個變數(被稱為具有型別的暫存器)僅被賦值一次,這簡化了變數間相依性的分析。LLVM允許程式碼被靜態的編譯,包含在傳統的GCC系統底下,或是類似JAVA等後期編譯才將IF編譯成機器碼所使用的即時編譯(JIT)技術。它的型別系統包含基本型別(整數或是浮點數)及五個複合型別指標陣列、向量、結構及函式),在LLVM具體語言的型別建制可以以結合基本型別來表示,舉例來說,C++所使用的class可以被表示為結構、函式及函式指標的陣列所組成。

LLVM JIT編譯器可以最佳化在執行時期時程式所不需要的靜態分支,這在一些部份求值(Partial Evaluation)的案例中相當有效,即當程式有許多選項,而在特定環境下其中多數可被判斷為是不需要。這個特色被使用在Mac OS X Leopard(v10.5)底下OpenGL的管線,當硬體不支援某個功能時依然可以被成功地運作[8]。OpenGL堆疊下的繪圖程式被編譯為IR,接著在機器上執行時被編譯,當系統擁有高階GPU時,這段程式會進行極少的修改並將傳遞指令給GPU,當系統擁有低階的GPU時,LLVM將會編譯更多的程式,使這段GPU無法執行的指令在本地端的中央處理器執行。LLVM增進了使用Intel GMA晶片等低階機器的效能。一個類似的系統發展於Gallium3D LLVMpipe,它已被合併到GNOME,使其可運行在沒有GPU的環境[9]

根據2011年的一項測試,GCC在執行時期的效能平均比LLVM高10%[10][11]。而2013年測試顯示,LLVM可以編譯出接近GCC相同效能的執行碼[12]

編譯器[編輯]

LLVM已經成為多個編譯器和代碼生成相關子專案的母專案。

前端[編輯]

LLVM最初被用來取代現有於GCC堆疊的程式碼產生器[13],許多GCC的前端已經可以與其運行,LLVM目前支援AdaC語言C++D語言FortranHaskellJulia (程式語言)Objective-CRustSwift (程式語言)的編譯,它使用許多的編譯器,有些來自4.0.1及4.2的GCC

LLVM引發一些人來為許多語言開發新的編譯器,其中一個最引發注意的就是Clang,它是一個新的編譯器,同時支援C、Objective-C以及C++。主要來自蘋果電腦的支援,Clang的目的用以取代GCC系統底下的C/Objective-C編譯器,在當代的系統,他較為容易與整合式開發環境(IDE)整合,而且對於執行緒有更好的支援。Clang從3.8版本開始已經支援OpenMP[14]。GCC底下Objective-C的開發已經停滯,而蘋果電腦已經將其支援移至其他的維護分支。

Utrecht Haskell編譯器可以產生LLVM使用的程式碼,但它還在初期的開發階段,並且在許多案例,展示他比起C程式碼產生器擁有更好的效率[15] Glasgow Haskell Compiler(GHC)擁有一個可以運作的LLVM後端,程式執行效能對比起原先的編譯器可以達到30%的加速,它僅比一個由GHC所實現,並擁有多項最佳化技術的編譯器還慢[16]

還有其他的元件在不同的開發階段,包含(但不限於)Java bytecode[17]通用中間語言(CIL)、MacRuby(實現Ruby 1.9)、Standard ML及新的graph coloring暫存器組態. [來源請求]

中間端[編輯]

LLVM的核心是中間端表達式(Intermediate Representation,IR),一種類似組譯的底層語言。IR是一種強型別精簡指令集Reduced Instruction Set Computing,RISC),並對目標指令集進行了抽象。例如,目標指令集的函式呼叫慣例被抽象為callret指令加上明確的參數。另外,IR採用無限個數的暫存器,使用如%0,%1等形式表達。LLVM支援三種表達形式:人類可讀的組譯,在C++中物件形式和序列化後的bitcode形式。

例如,一個簡單的Hello World程式可以表達為如下的組譯形式。對IR語言的完整描述請參考LLVM官方文件[18]

@.str = internal constant [14 x i8] c"hello, world\0A\00"

declare i32 @printf(i8*, ...)

define i32 @main(i32 %argc, i8** %argv) nounwind {
entry:
    %tmp1 = getelementptr [14 x i8], [14 x i8]* @.str, i32 0, i32 0
    %tmp2 = call i32 (i8*, ...) @printf( i8* %tmp1 ) nounwind
    ret i32 0
}

後端[編輯]

至3.4版本的LLVM已經支援多種後端指令集,比如ARMQualcomm HexagonMIPSNvidia並列指令集(PTX;在LLVM文件中被稱為NVPTX),PowerPCAMD TeraScale[19]AMD Graphics Core Next(GCN)、SPARCz/Architecture(在LLVM文件中被稱為SystemZ)、x86x86-64XCore。有部分平台功能並沒有完全實現。但x86、x86-64、z/Architecture、ARM和PowerPC的基本所有功能都有實現。[20] RISC-V也在版本7中實現。

LLVM機器碼(MC)子專案是LLVM將機器指令從文字形式轉換至機器碼的形式。在之前LLVM依靠系統或是平台專門的工具鏈將組譯翻譯為機器碼。LLVM機器碼的整合組譯器已經支援絕大多數LLVM的目標平台,如x86、x86-64、ARM和ARM64。對另一些平台,如幾種MIPS平台,組譯器支援已經加入但仍在beta階段。

連結器[編輯]

lld連結器子專案旨在為LLVM開發一個內建的,平台獨立的連結器[21],去除對所有第三方連結器的依賴。在2017年5月,lld已經支援ELFPE/COFF、 和Mach-O。在lld支援不完全的情況下,用戶可以使用其他專案,如GNU ld連結器。 lld支援連結時最佳化。當LLVM連結時最佳化被啟用時,LLVM可以輸出bitcode而不是本機代碼,而本機代碼生成由連結器最佳化處理。

C++標準庫[編輯]

LLVM專案包含一個C++標準庫的實現,具有MIT授權條款UIUC授權條款的雙授權條款。[22]

另見[編輯]

參考文獻[編輯]

  1. ^ Reedy, Geoff. Compiling Scala to LLVM. St. Louis, Missouri, United States. 2012-09-24 [2013-02-19]. 
  2. ^ Mono LLVM, [2013-03-10] 
  3. ^ Adam Treat, mkspecs and patches for LLVM compile of Qt4 網際網路檔案館存檔,存檔日期2011-10-04.
  4. ^ 存檔副本. [2011-12-22]. (原始內容存檔於2012-01-17). 
  5. ^ Chris Lattner discusses the name LLVM. [22 December 2011]. (原始內容存檔於2012年1月12日). 
  6. ^ ACM Awards. ACM. (原始內容存檔於2012-04-02). 
  7. ^ LLVM Language Reference Manual. [16 April 2012]. 
  8. ^ Chris Lattner. A cool use of LLVM at Apple: the OpenGL stack. LLVMdev mailing list. 15 August 2006 [26 October 2008]. (原始內容存檔於2006年11月4日). 
  9. ^ Michael Larabel, "GNOME Shell Works Without GPU Driver Support", phoronix, 6 November 2011
  10. ^ V. Makarov. SPEC2000: Comparison of LLVM-2.9 and GCC4.6.1 on x86. [3 October 2011]. 
  11. ^ V. Makarov. SPEC2000: Comparison of LLVM-2.9 and GCC4.6.1 on x86_64. [3 October 2011]. 
  12. ^ Michael Larabel. LLVM/Clang 3.2 Compiler Competing With GCC. 27 December 2012 [31 March 2013]. 
  13. ^ Lattner, Chris; Vikram Adve. Architecture For a Next-Generation GCC. First Annual GCC Developers' Summit. May 2003 [6 September 2009]. 
  14. ^ Clang 3.8 Release Notes. [August 24, 2016]. 
  15. ^ Compiling Haskell To LLVM (PDF). [26 June 2008]. 
  16. ^ LLVM Project Blog: The Glasgow Haskell Compiler and LLVM. [13 August 2010]. 
  17. ^ Gaël Thomas; 等. VMKit: a substrate for virtual machines. LLVM.org.  VMKit 目前的開發已經停滯,並且只支援和 LLVM 3.3 協同編譯。對更高版本的 LLVM,需要對原始碼做一些修改。VMKit 在編譯時需要 LLVM 原始碼中的lib, include
  18. ^ llvm.org/docs/LangRef.html.
  19. ^ Stellard, Tom. [LLVMdev] RFC: R600, a new backend for AMD GPUs. llvm-dev (郵寄清單). March 26, 2012. 
  20. ^ Target-specific Implementation Notes: Target Feature Matrix // The LLVM Target-Independent Code Generator, LLVM site.
  21. ^ lld - The LLVM Linker. The LLVM Project. [May 10, 2017]. 
  22. ^ "libc++" C++ Standard Library. 

外部連結[編輯]