Apache Hive

維基百科,自由的百科全書

Apache Hive是一個建立在Hadoop架構之上的數據倉庫。它能夠提供數據的精煉,查詢和分析。Apache Hive起初由Facebook開發,目前也有其他公司使用和開發Apache Hive,例如Netflix等。亞馬遜公司也開發了一個定製版本的Apache Hive,亞馬遜網絡服務包中的Amazon Elastic MapReduce包含了該定製版本。

hive頁面存檔備份,存於互聯網檔案館)是基於Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射為一張數據庫表,並提供簡單的SQL查詢功能,可以將SQL語句轉換為MapReduce任務進行運行。其優點是學習成本低,可以通過類SQL語句快速實現簡單的MapReduce統計,不必開發專門的MapReduce應用,十分適合數據倉庫的統計分析。