跳至內容

Apache Arrow

維基百科,自由的百科全書
Apache Arrow
開發者Apache軟件基金會
首次發佈2016年10月10日,​8年前​(2016-10-10
當前版本
  • 13.0.0(2023年8月23日)[1]
編輯維基數據鏈接
原始碼庫https://github.com/apache/arrow
程式語言C, C++, C#, Go, Java, JavaScript, MATLAB, Python, R語言, Ruby, Rust
類型數據格式, 演算法
許可協議Apache許可證 2.0
網站arrow.apache.org

Apache Arrow 是一種與語言無關英語Language-agnostic軟件框架,用於開發處理欄式資料庫的數據分析應用程序。Apache Arrow包含一個標準化的物件欄內存格式,且能夠表示平面層級化數據,以便在現代CPUGPU硬件上進行高效率的分析操作。[2][3][4][5][6]這種功能反而會減少或則消除限制使用大型數據集的可行性因素,比如動態隨機存取存儲器的成本、易變性或則物理性的約束。[7]

註釋

[編輯]
  1. ^ Apache Arrow 13.0.0 (23 August 2023). 2023年8月23日 [2023年9月21日]. 
  2. ^ Apache Arrow and Distributed Compute with Kubernetes. [2018-12-13]. (原始內容存檔於2021-12-07). 
  3. ^ Baer, Tony. Apache Arrow: Lining Up The Ducks In A Row... Or Column. Seeking Alpha. [2016-02-17]. (原始內容存檔於2021-12-07). 
  4. ^ Baer, Tony. Apache Arrow: The little data accelerator that could. ZDNet. [2019-02-25]. (原始內容存檔於2021-12-07). 
  5. ^ Hall, Susan. Apache Arrow's Columnar Layouts of Data Could Accelerate Hadoop, Spark. The New Stack. [2016-02-23]. (原始內容存檔於2021-12-07). 
  6. ^ Yegulalp, Serdar. Apache Arrow aims to speed access to big data. InfoWorld. [2016-02-27]. (原始內容存檔於2016-08-19). 
  7. ^ Tanveer Ahmad. ArrowSAM: In-Memory Genomics Data Processing through Apache Arrow Framework. bioRxiv. 2019: 741843 [2021-12-07]. doi:10.1101/741843可免費查閱. (原始內容存檔於2021-12-07). 

參閱

[編輯]

外部連結

[編輯]