R语言:修订间差异

维基百科,自由的百科全书
删除的内容 添加的内容
修复参考资料格式错误
Tommyren留言 | 贡献
第39行: 第39行:
同样在1997年,R核心小组正式成立,以进一步对R语言进行开发。截止2022年1月,小组成员包括伊哈卡、杰特曼、钱伯斯以及梅克勒,同时也包括了统计学家{{le|库尔特·奥尔尼克|Kurt Hornik}}、道格拉斯·贝茨、{{le|彼得·达尔高|Peter Dalgaard}}、{{le|卢克·蒂尔尼|Luke Tierney}}、弗里德里希·莱施、{{le|托马斯·拉姆利|Thomas Lumley}}、邓肯·坦普尔·朗、迈克尔·劳伦斯、乌韦·利格斯、布莱恩·里普利、塞巴斯蒂安·迈耶、保罗·默雷尔、马丁·普卢默、迪伊潘·萨卡尔、西蒙·乌尔巴内克以及计算机科学家托马斯·卡利贝拉。<ref name=":02" />小组过去的成员包括塞思·福尔肯、圭多·马萨罗托、邓肯·默多克、马丁·摩根、海纳·施瓦特以及斯特凡诺·雅各斯。<ref>{{Cite web|title=R: Contributors|url=https://www.r-project.org/contributors.html|access-date=2022-01-03|work=www.r-project.org}}</ref>2003年4月<ref>{{Cite journal|title=R Foundation News|author=Martin Mächler|url=https://journal.r-project.org/archive/2014-2/r-foundation.pdf|journal=The R Journal|issue=2|others=Kurt Hornik|year=2014|volume=6|page=190-191}}</ref>,一个名为R基金会的非盈利组织正式成立,为的是更好地对R语言的开发提供支持。<ref name=":02" />
同样在1997年,R核心小组正式成立,以进一步对R语言进行开发。截止2022年1月,小组成员包括伊哈卡、杰特曼、钱伯斯以及梅克勒,同时也包括了统计学家{{le|库尔特·奥尔尼克|Kurt Hornik}}、道格拉斯·贝茨、{{le|彼得·达尔高|Peter Dalgaard}}、{{le|卢克·蒂尔尼|Luke Tierney}}、弗里德里希·莱施、{{le|托马斯·拉姆利|Thomas Lumley}}、邓肯·坦普尔·朗、迈克尔·劳伦斯、乌韦·利格斯、布莱恩·里普利、塞巴斯蒂安·迈耶、保罗·默雷尔、马丁·普卢默、迪伊潘·萨卡尔、西蒙·乌尔巴内克以及计算机科学家托马斯·卡利贝拉。<ref name=":02" />小组过去的成员包括塞思·福尔肯、圭多·马萨罗托、邓肯·默多克、马丁·摩根、海纳·施瓦特以及斯特凡诺·雅各斯。<ref>{{Cite web|title=R: Contributors|url=https://www.r-project.org/contributors.html|access-date=2022-01-03|work=www.r-project.org}}</ref>2003年4月<ref>{{Cite journal|title=R Foundation News|author=Martin Mächler|url=https://journal.r-project.org/archive/2014-2/r-foundation.pdf|journal=The R Journal|issue=2|others=Kurt Hornik|year=2014|volume=6|page=190-191}}</ref>,一个名为R基金会的非盈利组织正式成立,为的是更好地对R语言的开发提供支持。<ref name=":02" />


== 功能 ==
== 内置功能 ==
R主要用于数据分析。在R语言中,用于信息存储的[[数据结构]]包括[[向量]]、[[数组]]、[[串列 (抽象資料型別)|列表]]以及数据框。向量指一组带有固定顺序, [[資料類型|数据类型]]唯一的字串或数值,其内容可以填写到一维或多维的数组之中。二维数组也叫做[[矩阵]]。<ref name=":0">{{Cite book|chapter=Basics|title=Introductory Statistics with R|series=Statistics and Computing|url=https://doi.org/10.1007/978-0-387-79054-1_1|publisher=Springer|date=2008|location=New York, NY|isbn=978-0-387-79054-1|pages=1–29|doi=10.1007/978-0-387-79054-1_1|language=en|first=Peter|last=Dalgaard|editor-first=Peter|editor-last=Dalgaard}}</ref>R支持各种数组运算,与自由软件[[GNU Octave]]和商業軟件[[MATLAB]]的功能有所重叠。<ref>{{cite web|title=存档副本|url=http://www.sciviews.org/benchmark|accessdate=2007-11-03|archiveurl=https://web.archive.org/web/20090808220014/http://www.sciviews.org/benchmark/|archivedate=2009-08-08|deadurl=yes}}</ref><ref>{{Cite web|title=A Comparison Study on Execution Performance of MATLAB and APL|url=http://www.sable.mcgill.ca/~hanfeng.c/eli/res/Comparison.pdf|access-date=March 9, 2022|author=Han-feng Chen, Wai-Mee Ching, and Da Zheng|format=PDF|publisher=McGill University|language=EN}}</ref>列表指一组数据类型可能有所不同的对象。一个字串向量与数值向量合在一起就可以成为一个列表。数据框本质上是一个列表,里面包含了一个或多个长度相同的向量。数据框将这些向量合并成表格,每一行都有一个单一的名称。<ref name=":0" />[[标量]]这一数据类型在R语言中并不存在,所谓的标量就是一个长度为一的向量。<ref>{{Cite web|title=Data structures · Advanced R.|url=http://adv-r.had.co.nz/Data-structures.html|access-date=2022-03-09|work=adv-r.had.co.nz}}</ref>
R內建多種統計學及數字分析功能。R的功能也可以透過安裝[[軟體套件|套件]](Packages,用戶撰寫的功能)增強。因為S的血緣,R比其他統計學或數學專用的編程語言有更強的[[物件導向]](面向对象程序设计, S3, S4等)功能。


用户可以用R来进行一些基本的统计检验,构建线性及非线性的模型,对[[時間序列|时间序列]]加以分析,或对数据进行分类与[[聚类分析]]。R的另一強項是繪圖功能,画出的图表能够达到专业出版物的要求,也可加入數學符號。计算强度较大时,用户可在程序中嵌入C、[[C++]]以及FORTRAN语言以帮助运算。<ref>{{Cite web|title=R: What is R?|url=https://www.r-project.org/about.html|access-date=2022-03-09|work=www.r-project.org}}</ref>
R的另一強項是繪圖功能,製圖具有印刷的素質,也可加入數學符號。


因為S的血緣,R比其他統計學或數學專用的編程語言有更強的[[物件導向]](面向对象程序设计, S3, S4等)功能。
雖然R主要用於統計分析或者開發統計相關的軟體,但也有人用作[[矩陣]]計算。其分析速度可媲美专用于矩阵计算的自由软件[[GNU Octave]]和商業軟件[[MATLAB]]。<ref>{{cite web|title=存档副本|url=http://www.sciviews.org/benchmark|accessdate=2007-11-03|archiveurl=https://web.archive.org/web/20090808220014/http://www.sciviews.org/benchmark/|archivedate=2009-08-08|deadurl=yes}}</ref>


== 套件 ==
== 套件 ==
R的功能能夠透過由用戶撰寫的套件增強。增加的功能有特殊的統計技術、繪圖功能,以及編程介面和數據輸出/輸入功能。這些軟件包是由R語言、[[LaTeX]]、[[Java]]及最常用[[C語言]]和[[Fortran]]撰寫。下載的執行檔版本會連同一批核心功能的軟件包,而根據CRAN紀錄有一萬多種不同的軟件包。其中有幾款較為常用,例如用於[[計量經濟學|經濟計量]]、[[財經分析]]、[[人文科學]]與社會科學研究以及[[人工智能]]。<ref>{{cite web|title=存档副本|url=http://cran.r-project.org/src/contrib/Views/|accessdate=2007-06-04|archiveurl=https://web.archive.org/web/20070625000503/http://www.cran.r-project.org/src/contrib/Views/|archivedate=2007-06-25|deadurl=yes}}</ref>
R的功能能夠透過由用戶撰寫的套件(Packages)增強。增加的功能有特殊的統計技術、繪圖功能,以及編程介面和數據輸出/輸入功能。這些軟件包是由R語言、[[LaTeX]]、[[Java]]及最常用[[C語言]]和[[Fortran]]撰寫。下載的執行檔版本會連同一批核心功能的軟件包,而根據CRAN紀錄有一萬多種不同的軟件包。其中有幾款較為常用,例如用於[[計量經濟學|經濟計量]]、[[財經分析]]、[[人文科學]]與社會科學研究以及[[人工智能]]。<ref>{{cite web|title=存档副本|url=http://cran.r-project.org/src/contrib/Views/|accessdate=2007-06-04|archiveurl=https://web.archive.org/web/20070625000503/http://www.cran.r-project.org/src/contrib/Views/|archivedate=2007-06-25|deadurl=yes}}</ref>


== 發展 ==
== 發展 ==

2022年3月9日 (三) 15:07的版本

R
编程范型多重編程範式阵列式物件導向函數式反射式指令式[1]过程式[2]
設計者罗斯·伊哈卡罗伯特·杰特曼
實作者R核心開發小組
发行时间1993年8月,​30年前​(1993-08
当前版本
  • 4.4.0 (2024年4月24日;穩定版本)[3]
編輯維基數據鏈接
型態系統动态类型[4]
文件扩展名
網站www.r-project.org 編輯維基數據鏈接
啟發語言
SSchemeLisp
影響語言
Julia[7]

R语言是一種自由軟體程式語言與操作環境,主要用于统计分析、绘图以及数据挖掘。R本來由來自新西蘭奧克蘭大學的统计学家罗斯·伊哈卡罗伯特·杰特曼開發,現在由R核心小组負責開發,同时也有其他用户编写了诸多外挂的软件包。R以S语言为基础,其語法來自Scheme。R的后台程序大多由C语言FORTRAN语言和R自己写成。[8]

R语言是GNU計劃的一个项目,所以其原始碼可自由下載使用。R也有已編譯的執行檔版本可以下載,可在多种平台下运行,包括UNIX(也包括FreeBSDLinux)、WindowsMacOS[8]R可以以命令行操作,[8]同時有人開發了幾種圖形用戶界面,其中包括RStudio[8]Jupyter[9]

在TIOBE2022年1月对编程语言人气的排名中,R排名第12。[10]

发展历程

R语言以S语言为基础,增加了Scheme语言中词法作用域这一机制,使程序员得以将代码中某一对象的适用范围限制到一小段代码之中。[11]S由里克·贝克尔、约翰·钱伯斯英语John Chambers (statistician)、道格·邓恩、琼·麦克雷、以及朱迪·席林于1976年前后于贝尔实验室发明。[12]S是一种用于数据分析的解释型语言,无需编译器即可运行。通常用S语言编写的代码都可以不作修改地在R环境下运行。[13]Scheme是Lisp语言的一个分支,[14]杰拉尔德·J·萨斯曼小盖伊·L·斯蒂尔于1975年前后在麻省理工学院发明。[15]

1991年,新西兰奥克兰大学的统计学家罗斯·伊哈卡和罗伯特·杰特曼开始对S语言的一个新版本进行开发。[16]伊哈卡与杰特曼两人名字首字母都是R,R语言因此得名。同时,R这个单一字母的名字也表明R语言与S语言一脉相承。[8]1993年8月,伊哈卡与杰特曼在数据平台StatLib和邮件列表s-news中发布了R的早期版本。1995年,在统计学家马丁·梅克勒的建议下,伊哈卡与杰特曼通过GNU通用公共许可证把R做成了一款免费开源软件。软件于1995年6月进行了首次官方发布。[17]首个稳定测试版本(1.0)于2000年2月29日发布。[18]

R综合档案网(Comprehensive R Archive Network;CRAN)于1997年4月23日正式上线。CRAN除了收藏了R的執行檔下載版、原始碼和說明文件,也收錄了各種用戶撰寫的軟件包。CRAN最早有3个镜像以及12个软件包。[19]截止2022年1月,CRAN有101個鏡像站[20]以及18728个软件包。[21]

同样在1997年,R核心小组正式成立,以进一步对R语言进行开发。截止2022年1月,小组成员包括伊哈卡、杰特曼、钱伯斯以及梅克勒,同时也包括了统计学家库尔特·奥尔尼克英语Kurt Hornik、道格拉斯·贝茨、彼得·达尔高英语Peter Dalgaard卢克·蒂尔尼英语Luke Tierney、弗里德里希·莱施、托马斯·拉姆利英语Thomas Lumley、邓肯·坦普尔·朗、迈克尔·劳伦斯、乌韦·利格斯、布莱恩·里普利、塞巴斯蒂安·迈耶、保罗·默雷尔、马丁·普卢默、迪伊潘·萨卡尔、西蒙·乌尔巴内克以及计算机科学家托马斯·卡利贝拉。[8]小组过去的成员包括塞思·福尔肯、圭多·马萨罗托、邓肯·默多克、马丁·摩根、海纳·施瓦特以及斯特凡诺·雅各斯。[22]2003年4月[23],一个名为R基金会的非盈利组织正式成立,为的是更好地对R语言的开发提供支持。[8]

内置功能

R主要用于数据分析。在R语言中,用于信息存储的数据结构包括向量数组列表以及数据框。向量指一组带有固定顺序, 数据类型唯一的字串或数值,其内容可以填写到一维或多维的数组之中。二维数组也叫做矩阵[24]R支持各种数组运算,与自由软件GNU Octave和商業軟件MATLAB的功能有所重叠。[25][26]列表指一组数据类型可能有所不同的对象。一个字串向量与数值向量合在一起就可以成为一个列表。数据框本质上是一个列表,里面包含了一个或多个长度相同的向量。数据框将这些向量合并成表格,每一行都有一个单一的名称。[24]标量这一数据类型在R语言中并不存在,所谓的标量就是一个长度为一的向量。[27]

用户可以用R来进行一些基本的统计检验,构建线性及非线性的模型,对时间序列加以分析,或对数据进行分类与聚类分析。R的另一強項是繪圖功能,画出的图表能够达到专业出版物的要求,也可加入數學符號。计算强度较大时,用户可在程序中嵌入C、C++以及FORTRAN语言以帮助运算。[28]

因為S的血緣,R比其他統計學或數學專用的編程語言有更強的物件導向(面向对象程序设计, S3, S4等)功能。

套件

R的功能能夠透過由用戶撰寫的套件(Packages)增強。增加的功能有特殊的統計技術、繪圖功能,以及編程介面和數據輸出/輸入功能。這些軟件包是由R語言、LaTeXJava及最常用C語言Fortran撰寫。下載的執行檔版本會連同一批核心功能的軟件包,而根據CRAN紀錄有一萬多種不同的軟件包。其中有幾款較為常用,例如用於經濟計量財經分析人文科學與社會科學研究以及人工智能[29]

發展

生物信息学社群時常使用R進行分子生物學數據分析。Bioconductor計劃就是讓R作為基因圖譜分析工具。 Gnumeric開發者正和R開發者合作,改善Gnumeric計算結果的精確度。[30]

R新聞雜誌

《R新聞雜誌》(R Newsletter)每年會出版兩至三次,為一份免費的電子雜誌,內容有關統計學軟件發展及R語言開發資訊。第一期在2001年一月出版。从2008年开始,被R Journal替代。[31]

参考文献

  1. ^ Morandat, Floréal; Hill, Brandon; Osvald, Leo; Vitek, Jan. Noble, James , 编. Evaluating the Design of the R Language. ECOOP 2012 – Object-Oriented Programming. Lecture Notes in Computer Science (Berlin, Heidelberg: Springer). 2012: 104–131. ISBN 978-3-642-31057-7. doi:10.1007/978-3-642-31057-7_6 (英语). 
  2. ^ White, Homer. Programming Paradigms. Beginning Computer Science with R. 2021-01-31 [2021-07-18] (美国英语). 
  3. ^ 3.0 3.1 彼得·达尔高. [Rd] R 4.4.0 is released. 2024年4月24日 [2024年5月2日]. 
  4. ^ jmount. Why I don’t like Dynamic Typing. Win Vector LLC. 2012-02-25 [2021-07-18] (美国英语). 
  5. ^ R scripts. mercury.webster.edu. [2021-07-17]. 
  6. ^ R Data Format Family (.rdata, .rda). www.loc.gov. 2017-06-09 [2021-07-18]. 
  7. ^ Introduction. The Julia Manual. [2018-08-05]. (原始内容存档于20 June 2018). 
  8. ^ 8.0 8.1 8.2 8.3 8.4 8.5 8.6 R FAQ. cran.r-project.org. [2021-07-18]. 
  9. ^ Using the R programming language in Jupyter Notebook — Anaconda documentation. docs.anaconda.com. [2021-12-29]. 
  10. ^ index | TIOBE - The Software Quality Company. www.tiobe.com. [2021-07-18]. 
  11. ^ Morandat, Floréal; Hill, Brandon; Osvald, Leo; Vitek, Jan. Noble, James , 编. Evaluating the Design of the R Language. ECOOP 2012 – Object-Oriented Programming. Lecture Notes in Computer Science (Berlin, Heidelberg: Springer). 2012: 104–131. ISBN 978-3-642-31057-7. doi:10.1007/978-3-642-31057-7_6 (英语). 
  12. ^ Becker, Richard A. A Brief History of S. 
  13. ^ R: What is R?. www.r-project.org. [2021-07-18]. 
  14. ^ John M. Chambers. S, R, and Data Science. The R Journal. 2020, 11 (1): 462-476. 
  15. ^ Sussman, Gerald Jay; Steele, Guy L. The First Report on Scheme Revisited. Higher-Order and Symbolic Computation. 1998-12-01, 11 (4): 399–404. ISSN 1573-0557. doi:10.1023/A:1010079421970 (英语). 
  16. ^ Academic unfazed by rock star status. NZ Herald. [2022-01-03] (en-NZ). 
  17. ^ R : Past and Future History -- A Free Software Project. cran.r-project.org. [2022-01-03]. 
  18. ^ Ross Ihaka. The R Project: A Brief History and Thoughts About the Future (pdf). Ross Ihaka. [2022-01-03] (英语). 
  19. ^ ANNOUNCE: CRAN. stat.ethz.ch. [2022-01-03]. 
  20. ^ CRAN - Mirrors. cran.r-project.org. [2022-01-15]. 
  21. ^ CRAN - Contributed Packages. cran.r-project.org. [2022-01-03]. 
  22. ^ R: Contributors. www.r-project.org. [2022-01-03]. 
  23. ^ Martin Mächler. Kurt Hornik. R Foundation News (PDF). The R Journal. 2014, 6 (2): 190-191. 
  24. ^ 24.0 24.1 Dalgaard, Peter. Basics. Dalgaard, Peter (编). Introductory Statistics with R. Statistics and Computing. New York, NY: Springer. 2008: 1–29. ISBN 978-0-387-79054-1. doi:10.1007/978-0-387-79054-1_1 (英语). 
  25. ^ 存档副本. [2007-11-03]. (原始内容存档于2009-08-08). 
  26. ^ Han-feng Chen, Wai-Mee Ching, and Da Zheng. A Comparison Study on Execution Performance of MATLAB and APL (PDF). McGill University. [March 9, 2022] (英语). 
  27. ^ Data structures · Advanced R.. adv-r.had.co.nz. [2022-03-09]. 
  28. ^ R: What is R?. www.r-project.org. [2022-03-09]. 
  29. ^ 存档副本. [2007-06-04]. (原始内容存档于2007-06-25). 
  30. ^ Gnumeric, Team. Gnumeric 1.4 is Here!. The GNOME Project. 2004年12月19日 [2006-04-30]. (原始内容存档于2006年10月5日). 
  31. ^ 存档副本. [2007-06-04]. (原始内容存档于2007-05-28). 

外部链接

参见