软件简介

让天下没有难做的大数据模型!

功能

下面是弥勒佛框架解决的问题类型,括号中的斜体代表尚未实现以及预计实现的时间

  • 监督式学习:最大熵分类模型(max entropy classifier),决策树模型(decision tree based models,2014 Q1

  • 非监督式学习:聚类问题(k-means,2014 Q1

  • 在线学习:在线梯度递降模型(online stochastic gradient descent)

  • 神经网络(2014 Q2/3

项目实现了下面的组件

    现有的机器学习框架/软件包存在几个问题:

  • 无法处理大数据:多数Python,Matlab和R写的训练框架适合处理规模小的样本,没有为大数据优化。

  • 不容易整合到实际生产系统:standalone的程序无法作为library嵌入到大程序中。

  • 模型单一:一个软件包往往只解决一个类型的问题(比如监督式或者非监督式)。

  • 不容易扩展:设计时没有考虑可扩展性,难以添加新的模型和组件。

  • 代码质量不高:代码缺乏规范,难读懂、难维护。

    弥勒佛项目的诞生就是为了解决上面的问题,在框架设计上满足了下面几个需求:

  • 处理大数据:可随业务增长scale up,无论你的数据样本是1K还是1B规模,都可使用弥勒佛项目。

  • 为实际生产:模型的训练和使用都可以作为library或者service整合到在生产系统中。

  • 丰富的模型:容易尝试不同的模型,在监督、非监督和在线学习等模型间方便地切换。

  • 高度可扩展:容易添加新模型,方便地对新模型进行实验并迅速整合到生产系统中。

  • 高度可读性:代码规范,注释和文档尽可能详尽,适合初学者进行大数据模型的学习。

展开阅读全文

代码

评论 (4)

加载中
打分: 力荐
怎么使用?
2017/01/24 17:37
回复
举报
命名牛逼 #MLF#
2016/05/03 12:14
回复
举报
正好最近学机器学习的各种算法! #MLF#
2016/05/03 17:08
回复
举报
提供什么语言接口 #MLF#
2016/05/03 19:53
回复
举报
更多评论
暂无内容
发表了博客
2018/06/26 22:02

央行mlf,SLF,PSL,MLF,SLO

央行mlf是什么意思 中国人民银行 中国人民银行(The People's Bank Of China,英文简称PBOC),简称央行,是中华人民共和国的中央银行,中华人民共和国国务院组成部门。在国务院领导下,制定和执行货币政策,防范和化解金融风险,维护金融稳定。 公开市场回购 中央银行如何运用公开市场操作 央行的公开市场操作有:一个是...

0
0
发表了博客
2019/05/24 11:06

为什么Microsoft Office 2016安装时不能自选安装组件和安装路径?

使用特别版本的安装镜像文件 SW_DVD5_Office_Professional_Plus_2016_64Bit_ChnSimp_MLF_X20-42426.iso,请自行搜索和下载 文件: SW_DVD5_Office_Professional_Plus_2016_64Bit_ChnSimp_MLF_X20-42426.ISO 大小: 1123452928 字节 MD5: 60DC8B1892F611E41140DD3631F39793 SHA1: AEB58DE1BC97685F8BC6BFB0A614A8EF6903E318...

0
0
发表了博客
2019/08/07 14:45

Office批量授权(VL)版本和激活方法

Office 2010 Office 2010中文专业增强版 32位 文件名: SW_DVD5_Office_Professional_Plus_2010w_SP1_W32_ChnSimp_CORE_MLF_X17-76734.iso SHA1校验码: 581ED02AC171DB18E80B277214AB6B952038F599 下载链接: ed2k://|file|SW_DVD5_Office_Professional_Plus_2010w_SP1_W32_ChnSimp_CORE_MLF_X17-76734.iso|1412091904|79B...

0
0
发表了博客
2018/04/08 14:58

Office 2016系列下载地址

版本:Office 2016 Pro Plus 64位 文件名:SW_DVD5_Office_Professional_Plus_2016_64Bit_ChnSimp_MLF_X20-42426.ISO 文件大小: 1123452928 字节 MD5: 60DC8B1892F611E41140DD3631F39793 SHA1: AEB58DE1BC97685F8BC6BFB0A614A8EF6903E318 CRC32: 8D8AC6D1 下载地址:ed2k://|file|SW_DVD5_Office_Professional_Plus_201...

0
0
发表了博客
2018/01/28 18:03

office2016 下载路径

版本:Office 2016 Pro Plus 64位 文件名:SW_DVD5_Office_Professional_Plus_2016_64Bit_ChnSimp_MLF_X20-42426.ISO 文件大小: 1123452928 字节 MD5: 60DC8B1892F611E41140DD3631F39793 SHA1: AEB58DE1BC97685F8BC6BFB0A614A8EF6903E318 CRC32: 8D8AC6D1 下载地址:ed2k://|file|SW_DVD5_Office_Professional_Plus_201...

0
0
发表了博客
2019/08/27 11:07

使用2种python脚本工具将2个txt文档中的文字进行比较,并计算出Corr, WER正确率,准确率

一。准备: linux服务器,src2mlf.py rec2mlf.py HResults文件,1份源文件和1份需要对比的文件。文件放置于本人云盘 二。使用方法: 1. 对比工具 HResults 需要运行在linux环境下,且仅支持mlf文件的对比 2. 两种python脚本工具 src2mlf.py 和 result2mlf.py , 将txt文件转换成 mlf文件 src文件为原始测试集,result文件...

0
0
发表了博客
2019/04/15 10:54

msdn原版系统和原版office

建议使用迅雷下载工具进行下载 激活详见:在线激活win10、win8/8.1和office2019、2016、2013等的kms激活工具 windows 10 家庭版/家庭单语言版/专业版/教育版/专业教育版/专业工作站版 简体中文 32位:ed2k://|file|cn_windows_10_consumer_edition_version_1803_updated_march_2019_x86_dvd_6fdd5a7b.iso|4163999744|FA6...

0
0
11/16 09:07

无需用户输入,Adobe提出自动生成高质量合成图像新方法

选自arXiv 作者:He Zhang等 机器之心编译 编辑:小舟、杜伟 没有用户输入,也能生成高质量的合成图像吗? 图像合成是指组合不同图像中的部分区域以合成一张新的图像,一个常见的用例是肖像图片的背景替换。为了获...

0
0
11/15 22:55

无需用户输入,Adobe提出自动高质量图像合成新方法

本文转载自机器之心。 选自arXiv 作者:He Zhang等 机器之心编译 编辑:小舟、杜伟 没有用户输入,也能生成高质量的合成图像吗? 图像合成是指组合不同图像中的部分区域以合成一张新的图像,一个常见的用例是肖像...

0
0
发表了博客
2014/01/29 13:37

基于HTK的语音拨号系统

基于 HTK 的语音拨号系统 Veket NWPU 2011-6-22 目标: 该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词( sub-word,eg.. 音素),具有一定的可扩充性。当加入一个新名字时,只需修改发音词典和任务语法即可。模型为连续混合高斯输出,运用语音决策树聚类形成的绑定状态式三音素。 内容: 1. 数据准备 (1) ...

0
0
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
暂无内容
4 评论
195 收藏
分享
返回顶部
顶部