机器学习库 Apache Mahout

Apache
Java
跨平台
Apache
2008-11-23

Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。

Mahout 项目是由 Apache Lucene(开源搜索)社区中对机器学习感兴趣的一些成员发起的,他们希望建立一个可靠、文档翔实、可伸缩的项目,在其中实现一些常见的用于集群和分类 的机器学习算法。该社区最初基于 Ngetal. 的文章 “Map-Reduce for Machine Learning on Multicore”,但此后在发展中又并入了更多广泛的机器学习方法。

Mahout 的目标还包括:

  • 建立一个用户和贡献者社区,使代码不必依赖于特定贡献者的参与或任何特定公司和大学的资金。

  • 专注于实际用例,这与高新技术研究及未经验证的技巧相反。

  • 提供高质量文章和示例。

加载中

评论(1)

缪斯的情人
缪斯的情人
嗯,收了 Apache Mahout

Apache Mahout 0.11.2 发布,机器学习库

Apache Mahout 0.11.2 发布,该版本支持 Spark 1.5.2 ,在稀疏向量和矩阵计算上提升了大约 30% 左右的性能。修复的 bug 包括: MAHOUT-1640: Better collections would significantly improv...

2016/03/13 07:07

Apache Mahout 0.11.1 发布,机器学习库

Apache Mahout PMC 发布了 Mahout 0.11.1 版本,现已提供下载: http://www.apache.org/dist/mahout/0.11.1/ Mahout 0.11.0 扩展了与 Spark 版本的兼容性,引入了一些新特性和 bug 修复。 Ma...

2015/11/08 07:41

Apache Mahout 0.10.1 发布

Apache Mahout 0.10.1 发布,此版本是 Mahout 0.10.0 版本的修复版本,修复了一些 bugs,升级 Spark 到 Spark 1.2.2 版本,现已提供下载:http://www.apache.org/dist/mahout/0.10.1/。 值得...

2015/06/01 07:31

Mahout 0.10.0 发布,机器学习库

Mahout 0.10.0 发布,此版本主要更新信息如下: MAHOUT-1630: Incorrect SparseColumnMatrix.numSlices() causes IndexException in toString() (Oleg Nitz, smarthi) MAHOUT-1665: Update h...

2015/04/10 16:13

Apache Mahout 0.9 发布

Apache Mahout 0.9 发布,此版本解决了 113 个独立 JAR包 问题;包括了一些新特性, bug 修复,还删除了在 0.8 版本弃用的算法。主要更新内容如下: -  MAHOUT-1245: A new and impro...

2014/02/19 08:29

Apache Mahout 0.8 发布,机器学习库

Apache Mahout 0.8 发布了,Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使...

2013/07/26 07:46

Apache Mahout 0.6 发布

Mahout是一个利用Map/Reduce的机器学习算法库,其思想源于斯坦福大学几个学者在2006年的nips会议上发表的一篇文章“Map- Reduct for Machine Learning on Multicore" Apache Mahout 0.6 发布...

2012/02/07 13:41

没有更多内容

加载失败,请刷新页面

没有更多内容

1
回答
hadoop mahout:org.apache.classifier.df.mapreduce.TestForest error

我搭了三台CentOS7虚拟机,安装配置好了hadoop-3.0.0,准备运行mahout上的随机森林算法来训练一个机器学习分类器。第一步是生成描述文件(...

05/02 21:31
1
回答
Data Mining

基于hadoop的生态系统,开发对针对用户的大数据分析, 大家有啥想说的没? 先不管海量的数据量,目前确实没有海量数据,想研究研究 大数据算法, 不知道如...

2016/10/20 19:12
2
回答
mahout在Hadoop集群上开发过程

新手请教一个问题:现在配置好了一个三个节点的分布式系统(一个主节点,两个分节点)。我要做的是:做一个分布式推荐测试。现在的问题是:1、mahout是不是安...

2015/06/07 13:56
5
回答
Mahout 频繁模式挖掘

大家好 我用mahout 0,6关联规则推荐算法 代码如下: int minSupport = 2; int maxHeapSize = 100; Str...

2014/10/30 15:49
3
回答
hadoop+mahout

@李航421 你好,想跟你请教个问题:我在使用hadoop2.2.0开发mahout0.9的时候遇见一个奇怪的问题,第一个job能执行成功,启动第二个jo...

2014/08/12 15:04
1
回答
CDH5+mahout0.8

@wennan 你好,想跟你请教个问题:您是否在cdh5套件上开发mahout0.8程序,我最近在试着编写程序调用商品推荐算法,但是运行一个job完成之后...

2014/08/12 14:39
1
回答
Mahout是否提供Hbase的接口

我知道mahout可以将数据以文件格式输入,也支持Mysql,但是都作为Apache的项目,mahout能不能直接使用hbase里的数据呢?

2014/05/24 11:35
1
回答
mahout源代码导入myeclipse10

本人刚刚学习mahout,网上说myeclipse有自带maven,所以不需要再安装maven,可是我导入了mahout源代码时,出现 Cannot co...

2013/12/06 17:02
15
回答
探索 Python、机器学习和 NLTK 库

开发一个应用程序,使用 Python、NLTK 和机器学习对 RSS 提要进行分类 作者:Chris Joakim, 高级软件工程师, Primedia ...

2012/12/19 09:00
1
回答
mahout使用mysql数据来进行推荐

请问如果是使用mysql的数据,mahout里有自带类 MYSQLJDBCDataModel来实现,但是要求JNDI啥是“mysql\taste”,看到网...

2014/02/25 18:11

没有更多内容

加载失败,请刷新页面

暂无博客

返回顶部
顶部