2010年10大热门的开源NoSQL服务器软件

红薯
 红薯
发布于 2010年12月30日
收藏 33

本周日,来 OSC·年终盛典收割技术干货,get新技能!!>>>

NoSQL,就是反SQL,是一项全新的数据库革新运动,特别是在 2010 年得以迅猛发展。而各种开源的 NoSQL 软件突然间涌现在你面前。目前似乎没有对 NoSQL 给出一个标准的定义,也没有相应的规范,但从这些软件可以看出 NoSQL 软件的共同点:独立运行、K/V存储结构,这之前有人称之为集中式缓存服务,其实你可以把二者等同起来。

那么多的 NoSQL 软件,到底哪些更受欢迎呢?为此,开源中国社区为你评选出10款2010年最受关注的 NoSQL 软件。

 

1. Cassandra

Cassandra 在 2010 年出尽风头,但最终都以失败告终,包括 Twitter 以及 Digg 的案例使我们不得不对 NoSQL 技术是否成熟,是否能在大规模系统中应用产生了怀疑。但这并不影响 Cassandra 拔得头筹,因为还有 Facebook 的支持。

Apache Cassandra 是一套开源分布式Key-Value存储系统。它最初由Facebook开发,用于储存特别大的数据。Facebook目前在使用此系统

主要特性:

  • 分布式
  • 基于column的结构化
  • 高伸展性

Cassandra 采用 Java 开发,Apache 授权协议。

 

2. memcached

memcached 是老牌的独立缓存服务的领头羊,目前国内使用该系统的网站非常的多,在这基础上还有国内开发的 memcachedb 是 memcached 支持持久化存储。

memcached 是一套分布式的快取系统,当初是Danga Interactive为了LiveJournal所发展的,但目前被许多软件(如MediaWiki)所使用。不过,memcached 缺乏认证以及安全管制

memcached 采用 C 语言开发,可在 Linux 系统下使用,采用 BSD 授权。

 

3. Membase

Membase 是 NoSQL 家族的一个新的重量级的成员,其完全兼容 memcached 的方式,有望笼络 memcached 的用户群。Membase 的可伸缩性、集群、复制以及管理方便等特性又是 memcached 无法匹敌的。

Membase 同样采用 C 语言开发,支持 Windows 和 Linux 系统,使用 Apache 授权协议。

 

接下来介绍两款国产的 NoSQL 软件:

4. Tair

Tair 是由淘宝网自主开发的分布式Key/Value结构数据存储系统,在淘宝网有着大规模的应用。您在登录淘宝、查看商品详情页面或者在淘江湖和好友“捣浆糊”的时候,都在直接或间接地和Tair交互。

Tair 采用 C 语言开发,支持 Linux 系统,使用 GPLv2 授权协议。

 

5. BeansDB

BeansDB 是豆瓣网开发的一个主要针对大数据量、高可用性的分布式Key Value存储系统,采用HashTree和简化的版本号来快速同步保证最终一致性(弱),一个简化版的 Dynamo

它采用类似memcached的去中心化结构,在客户端实现数据路由。目前只提供了 Python版本的客户端,其它语言的客户端可以由memcached的客户端稍加改造得到。

主要特性包括:

  • 高可用:通过多个可读写的用于备份实现高可用;
  • 最终一致性:通过哈希树实现快速完整数据同步(短时间内数据可能不一致);
  • 容易扩展:可以在不中断服务的情况下进行容量扩展;
  • 高性能:异步IO和高性能的Key Value数据Tokyo Cabinet
  • 可配置的可用性和一致性:通过N,W,R进行配置;
  • 简单协议:Memcached兼容协议,大量可用客户端。

BeansDB 采用 Python 语言开发,支持 Linux 系统,使用 BSD 授权协议。

 

6. Redis

Redis一个高性能的key-value数据库。 redis的 出现,很大程度补偿了memcached这类keyvalue存储的不足,在部分场合可以对关系数据库起到很好的补充作用。它提供了Python,Ruby,Erlang,PHP客户端,使用很方便。

Redis 的短板:

  • 这个项目还很新,可能还不足够稳定,而且没有在实际的一些大型系统应用的实例。
  • 缺乏mc中批量get也是比较大的问题,始终批量获取跟多次获取的网络开销是不一样的。

Redis 采用 C 语言开发,支持 Linux 系统,使用 BSD 授权协议。

 

7.  CouchDB

Apache CouchDB 是一个面向文档的数据库管理系统。它提供以 JSON 作为数据格式的 REST 接口来对其进行操作,并可以通过视图来操纵文档的组织和呈现。 CouchDB 是 Apache 基金会的顶级开源项目。

CouchDB落实到最底层的数据结构就是两类B+Tree 。

不过最近有消息说 CouchDB 将走一条不同于 NoSQL 的路子,具体情况如何我们只能拭目以待。

CouchDB 是用 ErLang 开发的哦,跨平台支持,Apache 授权协议。

 

8. Tokyo Cabinet

Tokyo Cabinet 是一个DBM的实现。这里的数据库由一系列key-value对的记录构成。key和value都可以是任意长度的字节序列,既可以是二进制也可以是字符串。这里没有数据类型和数据表的概念。

当做为Hash表数据库使用时,每个key必须是不同的,因此无法存储两个key相同的值。提供了以下访问方法:提供key,value参数来存储,按 key删除记录,按key来读取记录,另外,遍历key也被支持,虽然顺序是任意的不能被保证。这些方法跟Unix标准的DBM,例如GDBM,NDBM 等等是相同的,但是比它们的性能要好得多(因此可以替代它们)

当按B+树来存储时,拥用相同key的记录也能被存储。像hash表一 样的读取,存储,删除函数也都有提供。记录按照用户提供的比较函数来存储。可以采用顺序或倒序的游标来读取每一条记录。依照这个原理,向前的字符串匹配搜 索和整数区间搜索也实现了。另外,B+树的事务也是可用的。

Tokyo Cabinet 采用 C 语言开发,支持 Linux 系统,使用 LGPL 授权协议。

 

9. OrientDB

Orient DB 是一个可伸缩的文档数据库,支持 ACID 事务处理。使用 Java 5 实现。OrientDB 最强的一个地方是可以使用 类 SQL 的查询语句进行数据查询。

 

OrientDB 采用 Java 语言开发,跨平台支持,使用 Apache 授权协议。

 

10. Hibari

Hibari (在日语中意思为“云雀”)是一个专为高可靠性和大数据存储的数据库引擎,可用于云计算环境中,例如 webmail、SNS 和其他要求T/P级数据存储的环境中。Hibari 支持 Java, C/C++, Python, Ruby, 和 Erlang 语言的客户端。

Hibari 并不是一个关系数据库,主要是通过 key-value 的方法进行数据存储。

Hibari 使用 ErLang 语言开发,支持 Linux/BSD 系统,Apache 授权协议。

 

是否意犹未尽?更多的 NoSQL 开源项目请看此处

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 OSCHINA 社区 [http://www.oschina.net]
本文标题:2010年10大热门的开源NoSQL服务器软件
加载中

最新评论(23

G.
G.

引用来自“sunjunyi”的评论

2011年,我争取让TreapDB也上榜,-_-!。http://www.oschina.net/p/treapdb

这是你开发的吧?
CheckStyle
CheckStyle
我提出的问题只是“特定领域”?你从哪儿看出来是“特定领域”而需要选择传统关系型数据库呢?
CheckStyle
CheckStyle
不用怀疑软件本身?你以为软件本身的质量都很好么?小朋友,你用过么?你每天上Mongobd的JIRA跟踪bug么?用源代码build过Mongobd么?
CheckStyle
CheckStyle
哇,小朋友开始教育老革命了
ValueError
ValueError

引用来自“CheckStyle”的评论

不过呢,能用上coherence的项目,呵呵,可靠性方面的要求,预算款的金额,哪里是Mongobd之类可以掺合的呢?

你说的这些本来就不是该NoSQL干的事,至于MongoDB,有视觉中国成功运用的例子,不用怀疑软件本身。你提出的问题只是特定领域,本来就应该果断选择关系型数据库的。Oracle用的舒心是要版权费用的,不应该和开源产品放在一起比较,因为开源产品购买了技术支持也一样舒心。
一香蒲
一香蒲
NOSQL是Not Only SQL吧...为什么要反SQL呢?
fxsjy
fxsjy
2011年,我争取让TreapDB也上榜,-_-!。http://www.oschina.net/p/treapdb
CheckStyle
CheckStyle
不过呢,能用上coherence的项目,呵呵,可靠性方面的要求,预算款的金额,哪里是Mongobd之类可以掺合的呢?
CheckStyle
CheckStyle
个人认为,replication模式,数据真别太多,主从节点之间,小心网络风暴。你们主节点的配置如何?网络环境如何?子节点和主节点在不在一个DMZ里?数据增长率高不高?
r
reck
楼上的,BerkeleyDB在顺序IO访问表现还尚可,但随机IO访问时,性能下降很快阿。我测试下来的情况,不容乐观。
oracle coherence,谁用谁知道,replication模式数据上了8g,系统就开始神经质了,不是很稳定,甚至还会导致整个cluster挂掉。
distributed 模式,技术细节不方便说,但绝对也不是百分之百那么好的。
我去oracle技术大会北京站咨询过这些,只是国内用的人似乎较少,oracle都不肯派出开发组人来回答,最终草草了事。
返回顶部
顶部