Apache Mahout 正在参加 2020 年度 OSC 中国开源项目评选,请投票支持!
Apache Mahout 在 2020 年度 OSC 中国开源项目评选 中已获得 {{ projectVoteCount }} 票,请投票支持!
投票让它出道
已投票
Apache Mahout 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」 !
Apache Mahout 获得 2020 年度 OSC 中国开源项目评选「最佳人气项目」「最积极运营项目」 !
Apache Mahout 获得 2020 年度 OSC 中国开源项目评选「最积极运营项目」 !
授权协议 Apache
开发语言 Java 查看源码 »
操作系统 跨平台
软件类型 开源软件
开源组织 Apache
地区 不详
提 交 者 不详
适用人群 未知
收录时间 2008-11-23

软件简介

Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。

Mahout 项目是由 Apache Lucene(开源搜索)社区中对机器学习感兴趣的一些成员发起的,他们希望建立一个可靠、文档翔实、可伸缩的项目,在其中实现一些常见的用于集群和分类 的机器学习算法。该社区最初基于 Ngetal. 的文章 “Map-Reduce for Machine Learning on Multicore”,但此后在发展中又并入了更多广泛的机器学习方法。

Mahout 的目标还包括:

  • 建立一个用户和贡献者社区,使代码不必依赖于特定贡献者的参与或任何特定公司和大学的资金。

  • 专注于实际用例,这与高新技术研究及未经验证的技巧相反。

  • 提供高质量文章和示例。

展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论 (1)

加载中
嗯,收了 Apache Mahout
2013/08/07 14:01
回复
举报
更多评论
发表了资讯
2016/03/13 00:00

Apache Mahout 0.11.2 发布,机器学习库

Apache Mahout 0.11.2 发布,该版本支持 Spark 1.5.2 ,在稀疏向量和矩阵计算上提升了大约 30% 左右的性能。修复的 bug 包括: MAHOUT-1640: Better collections would significantly improve vector-operation speed MAHOUT-1800: Pare down Classtag overuse MAHOUT-1801: FastUtil to improve speed of Sparse Matrix Operations MAHOUT-1802: Capture attached checkpoints (if cached) Apache Mahout 是 Apache Software ...

0
32
发表了资讯
2015/11/08 00:00

Apache Mahout 0.11.1 发布,机器学习库

Apache Mahout PMC 发布了 Mahout 0.11.1 版本,现已提供下载: http://www.apache.org/dist/mahout/0.11.1/ Mahout 0.11.0 扩展了与 Spark 版本的兼容性,引入了一些新特性和 bug 修复。 Mahout 0.11.1 相比 Mahout 0.11.0 改进如下: Spark 1.4+ 支持 Dot Product 4x 性能提升 基于 matrix flaors 的 %*% 优化 详细改进请看发行说明。 Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目...

0
24
发表了资讯
2015/06/01 00:00

Apache Mahout 0.10.1 发布

Apache Mahout 0.10.1 发布,此版本是 Mahout 0.10.0 版本的修复版本,修复了一些 bugs,升级 Spark 到 Spark 1.2.2 版本,现已提供下载:http://www.apache.org/dist/mahout/0.10.1/。 值得关注的改进: 1. This release fixes a major memory usage bug in co-occurrence analysis used by the driver spark-itemsimilarity MAHOUT-1707 2. Support Spark 1.2.2 or less 3. Some minor fixes to Mahout-Samsara QR Decomposi...

1
8
发表了资讯
2015/04/10 00:00

Mahout 0.10.0 发布,机器学习库

Mahout 0.10.0 发布,此版本主要更新信息如下: MAHOUT-1630: Incorrect SparseColumnMatrix.numSlices() causes IndexException in toString() (Oleg Nitz, smarthi) MAHOUT-1665: Update hadoop commands in example scripts (akm) MAHOUT-1676: Deprecate MLP, ConcatenateVectorsJob and ConcatenateVectorsReducer in the codebase (apalumbo) MAHOUT-1622: MultithreadedBatchItemSimilarities outputs incorrect number ...

10
29
发表了资讯
2014/02/19 00:00

Apache Mahout 0.9 发布

Apache Mahout 0.9 发布,此版本解决了 113 个独立 JAR包 问题;包括了一些新特性, bug 修复,还删除了在 0.8 版本弃用的算法。主要更新内容如下: -  MAHOUT-1245: A new and improved Mahout website based on Apache CMS -  MAHOUT-1265: MultiLayer Perceptron (MLP) classifier    This is an early implementation of MLP to solicit user feedback, needs to be integrated into M...

6
18
发表了资讯
2013/07/26 00:00

Apache Mahout 0.8 发布,机器学习库

Apache Mahout 0.8 发布了,Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。 该版本主要是 1.0 版本发布之前的代码清理。同...

1
32
发表了资讯
2012/02/07 00:00

Apache Mahout 0.6 发布

Mahout是一个利用Map/Reduce的机器学习算法库,其思想源于斯坦福大学几个学者在2006年的nips会议上发表的一篇文章“Map- Reduct for Machine Learning on Multicore" Apache Mahout 0.6 发布了,建议所有开发者升级,该版本主要改进包括: Improved Decision Tree performance and added support for regression problems New LDA implementation using Collapsed Variational Bayes 0th Derivative Approximation Reduced run...

0
2
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
发表于运维专区
2018/05/02 21:31

hadoop mahout:org.apache.classifier.df.mapreduce.TestForest error

我搭了三台CentOS7虚拟机,安装配置好了hadoop-3.0.0,准备运行mahout上的随机森林算法来训练一个机器学习分类器。第一步是生成描述文件(/des.info);第二步是训练森林模型(/user/hadoop/forest);第三步是检测。 这是HDFS: [hadoop@hadoop1 ~]$ hadoop fs -ls / Found 5 items -rw-r--r-- 1 hadoop supergroup 8807688 2018-04-29 19:59 /des.info -rw-r--r-- 1 hadoop supergroup 79736192 2018-04-29 19:55 /features.txt...

1
0
发表了问答
2016/10/20 19:12

Data Mining

基于hadoop的生态系统,开发对针对用户的大数据分析, 大家有啥想说的没? 先不管海量的数据量,目前确实没有海量数据,想研究研究 大数据算法, 不知道如何入手啊~~

1
0
发表了问答
2015/06/07 13:56

mahout在Hadoop集群上开发过程

新手请教一个问题:现在配置好了一个三个节点的分布式系统(一个主节点,两个分节点)。我要做的是:做一个分布式推荐测试。现在的问题是:1、mahout是不是安装在分布式的节点上;2、maven可以装在我自己的笔记本上?3、怎么通过远程调控分布式推荐系统。软件版本:Ubuntu14.10 JDK1.8.40 Hadoop 2.6.0。另外我的电脑是win7,,32位。另外,希望有志同道合的伙伴一起学习分布式推荐系统。 感激不尽!...

3
0
发表了问答
2014/10/30 15:49

Mahout 频繁模式挖掘

大家好 我用mahout 0,6关联规则推荐算法 代码如下: int minSupport = 2; int maxHeapSize = 100; String input = "./models/casestudy-en/lda.dat"; String output = "output"; FPGrowth<String> fp = new FPGrowth<String>(); FileSystem fs = new RawLocalFileSystem(); Configuration conf = new Configuration(); String pattern = " \"[ ,\\t]*[,|\\t][ ,\\t]*\" "; try { fs = FileSystem.get(conf); SequenceFile.Wri...

5
0
发表了问答
2014/08/12 15:04

hadoop+mahout

@李航421 你好,想跟你请教个问题:我在使用hadoop2.2.0开发mahout0.9的时候遇见一个奇怪的问题,第一个job能执行成功,启动第二个job的时候出错,我运行的是itemrecommend那个商品推荐例子,恳请指教,谢谢

4
0
发表了问答
2014/08/12 14:39

CDH5+mahout0.8

@wennan 你好,想跟你请教个问题:您是否在cdh5套件上开发mahout0.8程序,我最近在试着编写程序调用商品推荐算法,但是运行一个job完成之后第二个job启动不了,不知道你是否遇见过?恳请指教。谢谢!

2
0
发表了问答
2014/05/24 11:35

Mahout是否提供Hbase的接口

我知道mahout可以将数据以文件格式输入,也支持Mysql,但是都作为Apache的项目,mahout能不能直接使用hbase里的数据呢?

1
0
发表了问答
2013/12/06 17:02

mahout源代码导入myeclipse10

本人刚刚学习mahout,网上说myeclipse有自带maven,所以不需要再安装maven,可是我导入了mahout源代码时,出现 Cannot complete the install because one or more required items could not be found. Software being installed: m2e connector for build-helper-maven-plugin 0.15.0.201207090124 (org.sonatype.m2e.buildhelper.feature.feature.group 0.15.0.201207090124) Missing requirement: m2e connector for build-h...

1
0
发表了问答
2012/12/19 09:00

探索 Python、机器学习和 NLTK 库

开发一个应用程序,使用 Python、NLTK 和机器学习对 RSS 提要进行分类 作者:Chris Joakim, 高级软件工程师, Primedia Inc 简介: 机器学习取决于 IT、数学和自然语言的交集,在大数据应用程序中会通常用到机器学习。本文将讨论 Python 编程语言和它的 NLTK 库,然后将它们应用于一个机器学习项目。 挑战:使用机器学习对 RSS 提要进行分类 最近,我接到一项任务,要求为客户创建一个 RSS 提要分类子系统。目标是读取几十个甚至...

21
138
发表了问答
2014/02/25 18:11

mahout使用mysql数据来进行推荐

请问如果是使用mysql的数据,mahout里有自带类 MYSQLJDBCDataModel来实现,但是要求JNDI啥是“mysql\taste”,看到网上说的好像是新建一个jdbc数据源,然后再获取datamodel,但是 如果是使用 j2ee框架 比如使用了 ibatis,好像已经可以使用spring建立 数据源对象 ,这样 到底该如何实现效率才会高些?谢谢 是看了这篇文章,所以想问问 http://blog.csdn.net/niuguy/article/details/6821661...

1
0
发表了问答
2013/09/11 13:50

mahout的对数似然相似源码分析

mahout中有个对数似然相似的方法,可以计算用户1和用户2之间的相似程度,如2个用户具有共同偏好item数量k11,用户1还偏好item数k12(不含共同k11,也就是用户1总偏好k11+k12),用户2还偏好item k21,用户1和用户2都不偏好的item数有k22,然后通过LogLikelihood.logLikelihoodRatio(k11,k12,k21,k22)得到2个用户的相似程度。 public static double logLikelihoodRatio(int k11, int k12, int k21, int k22) {     double rowEntropy ...

5
5
发表了问答
2012/08/30 20:11

关于Mahout聚类输出表示的问题

大家好,最近刚刚开始学习mahout,对聚类后的输出有一个疑问,希望大家指教。 我知道最后输出的一个clusteredPoints里包含了最后的聚类结果,里面记录了每个向量及其对应所分的类,但是我希望可以输出每个向量对应数据的key及其所对应所分的类,不知道有没有什么简单的方法可以实现? 比如说我的数据文件是这样的: Key class: class org.apache.hadoop.io.LongWritable Value Class: class org.apache.mahout.math.VectorWrita...

6
0
发表了问答
2012/10/09 13:43

如何使用mahout

本人菜鸟,在linux下部署了mahout,也按照网上的命令测试通过了(使用k-means),得到几个cluster的结果,但是看不懂,比如clusters-3目录下的part-r-00000中的内容如下:感觉这个是把数据分为6类,后面的{****}中的n是本类中的数据量,c是类中心点,不知道对不对,但是我想知道一个数据点分到了哪个类中,这里看不到,另外我想使用mahout做推荐,不知道该如何使用,恳请大家帮帮我,谢谢啦...

1
0
发表了问答
2010/01/23 01:10

基于 Apache Mahout 构建社会化推荐引擎

Web 2.0 的一个核心思想就是“群体智慧”,即基于大众行为,为每个用户提供个性化的推荐。这使得如何让用户能更快速更准确的获得所需要的信息,成为了 Web 应用成败的关键。Apache Mahout 是 ASF(Apache Software Foundation)的一个较新的开源项目,提供机器学习领域的一些经典算法的高效实现。本文主要讲述如何基于 Apache Mahout 来构建社会化推荐引擎,帮助 Web 应用开发者更高效的实现个性化推荐功能,从而提高最终用户满...

4
45
发表了问答
2009/10/15 17:48

Apache Mahout 简介

当研究院和企业能获取足够的专项研究预算之后,能从数据和用户输入中学习的智能应用程序将变得更加常见。人们对机器学习技巧(比如说集群、协作筛选和分 类)的需求前所未有地增长,无论是查找一大群人的共性还是自动标记海量 Web 内容。Apache Mahout 项目旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout 的创始者 Grant Ingersoll 介绍了机器学习的基本概念,并演示了如何使用 Mahout 来实现文档集群、提出建议和组织...

3
17
发表了问答
2012/06/15 10:27

在使用mahout的匿名推荐时候遇到了一个问题,您能帮我看看吗?

@Breath_L 你好,想跟你请教个问题:报出下面的异常:recommender.MovieDataModel cannot be cast to org.apache.mahout.cf.taste.impl.model.PlusAnonymousUserDataModel 这是我在AnonymousRecommender类(继承了UserBasedRecommender类)中的实现: public AnonymousRecommender() throws TasteException { super(); plusAnonymousModel = (PlusAnonymousUserDataModel) super.getDataModel(); } public synchronized Li...

1
0
发表了问答
2012/06/12 15:30

Apache Mahout 关于推荐的一些不解

@Breath_L 你好,想跟你请教个问题:打扰你,因为最近在学习mahout,遇到一些问题,向您请教下。 在mahout框架下,我现阶段学习到的是只有用户对某些物品进行评分了,才能对这个用户进行推荐,但是如果用户刚登陆,没有其他的操作,如何进行推荐呀(我知道在mahout有个匿名用户的推荐方式)?但是,用户已经输入了他的一些兴趣爱好了,怎样根据这些兴趣爱好对用户进行推荐呀。 还有,就是新加入的物品,只有这些物品的一些属性,...

3
0
发表了问答
2011/04/13 07:54

起点R3基于Mahout实现的推荐引擎

1、用户行为日志 起点R3电子商务搜索引擎演示系统中记录的用户行为数据主要包括四大类  搜索历史 搜索历史的记录主要包括用户信息、时间、地址、检索的关键词,检索关键词拼音及缩写,用户年纪等,其中,记录的时间包括检索发生时的小时、当天是周几、当天的日期信息;地址信息包括了省市区县信息。  点击历史 点击历史记录了当前点击记录的用户信息、时间、地址、检索词、点击记录的序号、点击记录的ID,其中,记录的时间包...

17
8
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
1 评论
226 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部