跳转到内容

NoSQL

本页使用了标题或全文手工转换
维基百科,自由的百科全书

这是本页的一个历史版本,由Cewbot留言 | 贡献2021年1月19日 (二) 11:59 (bot: 清理跨語言連結最终一致性成為內部連結:編輯摘要的red link經繁簡轉換後存在)编辑。这可能和当前版本存在着巨大的差异。

NOSQL(Not Only SQL)是對不同於傳統的關聯式資料庫数据库管理系统的統稱。

允許部分資料使用SQL系統儲存,而其他資料允許使用NOSQL系統儲存。其數據儲存可以不需要固定的表格模式以及元数据(metadata),也經常會避免使用SQL的JOIN操作,一般有水平可扩展性英语Database_scalability的特征。

发展历史

NOSQL一词最早出现于1998年,是Carlo Strozzi开发的一个轻量、开源、不提供SQL功能的关系数据库[1]

2009年,Last.fm的Johan Oskarsson发起了一次关于分布式开源数据库的讨论[2],来自Rackspace的Eric Evans再次提出了NOSQL的概念,这时的NOSQL主要指非关系型、分布式、不提供ACID的数据库设计模式。

2009年在亚特兰大举行的"no:sql(east)"讨论会是一个里程碑,其口号是"select fun, profit from real_world where relational=false;"。因此,对NOSQL最普遍的解释是“非关聯型的”,强调键-值存储面向文档数据库的优点,而不是单纯的反对RDBMS。

基于2014年的收入,NOSQL市场领先企业是MarkLogic英语MarkLogicMongoDBDatastax英语DataStax[3]。基于2015年的人气排名,最受欢迎的NOSQL数据库是MongoDBApache CassandraRedis[4]

特点

当代典型的關聯式資料庫在一些数据敏感的应用中表现了糟糕的性能,例如为巨量文档建立索引、高流量网站的网页服务,以及发送流式媒体[5]。关系型数据库的典型实现主要被调整用于执行规模小而读写频繁,或者大批量读而极少写访问的事务。

NOSQL的結構通常提供弱一致性的保證,如最終一致性,或交易僅限於單個的數據項。不過,有些系統,提供完整的ACID保證在某些情況下,增加了補充中間件層(例如:CloudTPS)[6]。有兩個成熟的系統有提供快照隔離的列存儲:像是Google基於過濾器系統的BigTable[7],和滑鐵盧大學开发的HBase[8]。這些系統,自主開發,使用類似的概念來實現多行(multi-row)分散式ACID交易的快照隔離(snapshot isolation)保證為基礎列儲存,無需額外的資料管理開銷,中間件系統部署或維護,減少了中間件層。

少数NOSQL系统部署了分布式结构,通常使用分散式雜湊表(DHT)将数据以冗余方式保存在多台服务器上。依此,扩充系统时候添加服务器更容易,并且扩大了对服务器失效的承受能程度。[9]

分类

文档存储

名稱 語言
BaseX XQueryJava
CouchDB Erlang
eXist XQuery
iBoxDB JavaC#
Jackrabbit Java
Lotus Notes LotusScriptJava
MarkLogic Server XQuery
MongoDB C++
RethinkDB C++
OrientDB Java
SimpleDB Erlang
Terrastore Java
ElasticSearch Java
No2DB C#

图数据库

名稱 語言
AllegroGraph SPARQL
Sparksee JavaC#
Neo4j Java
FlockDB Scala
JanusGraph Java

鍵-值(key‐value)儲存

最終一致性鍵-值儲存

架構性鍵-值储存

主機式服務

Key/value硬盘存储

Key/value RAM存储

Key-value基于Paxos算法的存储

多数据库

时序型数据库

名稱 語言
Graphite Python
InfluxDB Go
Informix TimeSeries Erlang
OpenTSDB Java
RRDtool C

对象数据库

列存储

参考文献

  1. ^ Lith, Adam; Jakob Mattson. Investigating storage solutions for large data: A comparison of well performing and scalable data storage solutions for real time extraction and batch insertion of data (PDF). Göteborg: Department of Computer Science and Engineering, Chalmers University of Technology: 15, 70. 2010 [2011-05-12]. Carlo Strozzi first used the term NOSQL in 1998 as a name for his open source relational database that did not offer a SQL interface[...] 
  2. ^ NOSQL 2009. Blog.sym-link.com. 2009-05-12 [2010-03-29]. (原始内容存档于2011-07-16). 
  3. ^ Hadoop-NoSQL-rankings. [2015-11-17]. 
  4. ^ DB-Engines Ranking. [2015-07-31]. (原始内容存档于2020-02-21). 
  5. ^ Agrawal, Rakesh et al. The Claremont report on database research (PDF). SIGMOD Record (計算機協會). 2008, 37 (3): 9–19. ISSN 0163-5808. doi:10.1145/1462571.1462573. 
  6. ^ CloudTPS: Scalable Transactions for Web Applications in the Cloud. Globule.org. [2010-03-29]. 
  7. ^ Large-scale Incremental Processing Using Distributed Transactions and Notifications (PDF). The 9th USENIX Symposium on Operating Systems Design and Implementation (OSDI 2010), Oct 4–6, 2010, Vancouver, BC, Canada. [2010-10-15]. 
  8. ^ Supporting Multi-row Distributed Transactions with Global Snapshot Isolation Using Bare-bones HBase (PDF). The 11th ACM/IEEE International Conference on Grid Computing (Grid 2010), Oct 25-29, 2010, Brussels, Belgium. [2010-10-15]. (原始内容 (PDF)存档于2011-06-29). 
  9. ^ Cassandra: Structured Storage System over a P2P Network (PDF). [2010-03-29]. 
  10. ^ Riak: An Open Source Scalable Data Store. 2010-11-28 [2010-11-28]. (原始内容存档于2010年12月31日). 
  11. ^ http://nosql.mypopescu.com/post/5633789299/intersystems-globals-and-gt-m-compared

外部链接

参见

  • 最终一致性(BASE——基本可用、弱状态、最终一致性——的其中一个组成要求,与关系数据库的Acid相对)
  • CAP