发表了博客
2019/05/08 14:29

入门推荐系统,你不应该错过的知识清单

https://www.jianshu.com/p/5585e7fe6062 【编者按】本账号为第四范式智能推荐产品先荐的官方知乎账号。本账号立足于计算机领域,特别是人工智能相关的前沿研究,旨在把更多与人工智能相关的知识分享给公众,从专业的角度促进公众对人工智能的理解;同时也希望为人工智能相关人员提供一个讨论、交流、学习的开放平台,从而早日让每个人都享受到人工智能创造的价值。 推荐系统目前已是学术界相当火热的研究方向。很多同学、研究者...

0
0
02/03 15:36

做数据分析,推荐7款好用的Python工具!

  Python数据分析好用的工具有哪些?今天小编为大家推荐七个数据分析师必备的Python工具。   Pandas:是一个开源的,BSD许可的库,为Python编程语言提供高性能,易于使用的数据结构和数据分析工具。Python长期以来一直非常适合做数据整理和准备,但对于数据分析和建模则不那么重要,Pandas有助于填补这一空白,使您能够在Python中执行整个数据分析工作流程,无需切换到更像域特定的语言。   PuLP:是一个用Python编写的线性...

0
0
发表了博客
2014/03/03 13:37

Collaborative filtering with GraphChi

原帖地址 http://blog.csdn.net/lzt1983/article/details/7913420 原文链接:Collaborative filtering with GraphChi 本文是GraphChi平台的协同过滤工具箱的快速指南。到目前为止,已经支持ALS(最小二乘法)、SGD(随机梯度下降)、bias-SGD(带偏置的随机梯度下降)、SVD++、NMF(非负矩阵分解)、SVD(restarted Lanczos、one sided Lanczos,svd可以参考leftnoeasy的博客),并将实现更多的算法。 以下是这些方法所对应的论...

0
1
发表了博客
2019/11/05 14:09

开源的推荐系统

<div id="cnblogs_post_body" class="blogpost-body "> <div>我收集和整理的目前互联网上所能找到的知名开源推荐系统(open source project for recommendation system),并附上了个人的一些简单点评(未必全面准确),</div> <div>这方面的中文资料很少见,希望对国内的朋友了解掌握推荐系统有帮助</div> <div> </div> <div>陈运文</div> <div> </div> <div> <strong>SVDFeature</strong></div> <div>由上海交大...

0
0
2020/06/30 21:21

【回顾】推荐系统工程师技能树

经过多年的发展,推荐系统已经成为互联网产品的标配。很多产品甚至在第一版就被投资人或者创始人要求必须“个性化”,可见,推荐系统已经飞入寻常百姓家。而作为推荐系统的缔造者,推荐系统工程师也越来越受欢迎,本文总结了推荐系统工程师常用的技能树,供大家参考。 一、掌握核心原理的技能 1、数学:微积分,统计学,线性代数; 2、周边学科:信息论基础; 3、推荐算法:CF,LR,SVM,FM,FTRL,GBDT,RF,SVD,RBM,RNN,L...

0
0
发表了博客
2019/03/19 12:58

Spark Graphx

Graphx 概述 Spark GraphX是一个分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求。 众所周知·,社交网络中人与人之间有很多关系链,例如Twitter、Facebook、微博和微信等,这些都是大数据产生的地方都需要图计算,现在的图处理基本都是分布式的图处理,而并非单机处理。Spark GraphX由于底层是基于Spark来处理的,所以天然就是一个分布式的图处理系统。 图...

0
0
发表了博客
2018/05/16 19:22

Spark学习之路 (二十七)图简介

一、图 1.1 基本概念 图是由顶点集合(vertex)及顶点间的关系集合(边edge)组成的一种数据结构。 这里的图并非指代数中的图。图可以对事物以及事物之间的关系建模,图可以用来表示自然发生的连接数据,如:社交网络、互联网web页面 常用的应用有:在地图应用中找到最短路径、基于与他人的相似度图,推荐产品、服务、人际关系或媒体 二、术语 2.1 顶点和边 一般关系图中,事物为顶点,关系为边 2.2 有向图和无向图 在有向图中...

0
0
发表了博客
2019/12/01 00:11

大数据基础--大数据挖掘工具(刘鹏《大数据》课后习题答案)

1.简述常用机器学习系统和大数据挖掘工具有哪些。   (1)Mahout,Apache Mahout是一个由Java语言实现的开源的可拓展的机器学习算法库。    (2)Spark MLlib,运行在Spark平台上专门为集群上并行运行而设计,内存中更快地实现多次迭代,适用于大规模数据集。   (3)其他数据挖掘工具,有SystemML、GraphLab、Parameter Server、Scikit-Learn、Weka、基于R语言的机器学习库、H2O、腾讯大规模主题模型训练系统Peacock与深度...

0
0
2020/04/02 17:20

蚂蚁金服:超大规模分布式计算系统 + 超大规模分布式优化算法

人工智能大数据与深度学习 公众号: weic2c 近年来,随着“大”数据及“大”模型的出现,学术界和工业界对分布式机器学习算法引起了广泛关注。针对这一刚需,阿里集团和蚂蚁金服设计了自己的分布式平台——鲲鹏。鲲鹏结合了分布式系统及并行优化算法,解决了大规模机器学习算法带来的一系列问题,不仅囊括了数据/模型并行、负载平衡、模型同步、稀疏表示、工业容错等特性,而且还提供了封闭好的、宜于调用的 API 供普通的机器学...

0
0
发表了博客
2018/06/07 09:09

[转]成为一名推荐系统工程师永远都不晚

原链接:https://juejin.im/post/5a2102065188255cca52e12d 推荐系统工程师技能树 掌握核心原理的技能 数学:微积分,统计学,线性代数 周边学科:信息论基础 推荐算法:CF,LR,SVM,FM,FTRL,GBDT,RF,SVD,RBM,RNN,LSTM,RL 数据挖掘:分类,聚类,回归,降维,特征选择,模型评价 实现系统检验想法的技能: 操作系统:Linux 编程语言:Python/R, Java/C++/C,sql,shell RPC框架:thrift, Dubbo,gRPC web服务:torna...

0
0
发表了博客
2019/03/24 22:14

【转】成为一名推荐系统工程师永远都不晚

原文链接:《干货 | 成为一名推荐系统工程师永远都不晚》 推荐系统工程师技能树 掌握核心原理的技能 数学:微积分,统计学,线性代数 周边学科:信息论基础 推荐算法:CF,LR,SVM,FM,FTRL,GBDT,RF,SVD,RBM,RNN,LSTM,RL 数据挖掘:分类,聚类,回归,降维,特征选择,模型评价 实现系统检验想法的技能: 操作系统:Linux 编程语言:Python/R, Java/C++/C,sql,shell RPC框架:thrift, Dubbo,gRPC web服务:tornado...

0
0
发表于云计算专区
2014/09/04 11:24

基于spark的图计算框架GraphX

基于Spark的GraphX.pptx 1. Property Graph:用户定义的有向图,图中的每个顶点和每条边都附加一个用户定义的对象,允许在两个顶点之间并行存在多条边。每个顶点都具有一个64位的唯一标识(VertexID),GraphX并不强制VertexID有序。每条边则由起始和终止VertexID标识。 Graph具有两个参数化的类型:Vertex(VD)和Edge(ED),分别对应附加在顶点和边上的对象。当VD和ED为基本的数据类型时,Graph将把它们保存在数组中。 Graph和RDD...

0
0
2014/08/13 21:25

快刀初试:Spark GraphX在淘宝的实践

快刀初试:Spark GraphX在淘宝的实践 作者:明风 (本文由团队中梧苇和我一起撰写,并由团队中的林岳,岩岫,世仪等多人Review,发表于程序员的8月刊,由于篇幅原因,略作删减,本文为完整版) 对于网络科学而言,世间万物都可以抽象成点,而事物之间的关系都可以抽象成边,并根据不同的应用场景,生成不同的网络,因此整个世界都可以用一个巨大的复杂网络来代表。有关复杂网络和图算法的研究,在最近的十几年取得了巨大的进展,...

0
4
发表了博客
2019/06/04 18:01

GraphX介绍

转自:https://www.cnblogs.com/txq157/p/5978747.html 1、GraphX介绍 1.1 GraphX应用背景 Spark GraphX是一个分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求。 众所周知·,社交网络中人与人之间有很多关系链,例如Twitter、Facebook、微博和微信等,这些都是大数据产生的地方都需要图计算,现在的图处理基本都是分布式的图处理,而并非单机处理。Spark G...

0
0
发表于数据库专区
2017/12/18 23:19

《一起学图数据库》之三:图数据库市场格局

据数据库咨询公司DBEngines.com称,图数据库是所有数据管理系统中成长最快的分类。 由于很早开始被Twitter,Facebook和Google在内的公司采用,图已经演变成当今各行各业所使用的主流技术。 那么,图数据库为何如此受欢迎呢? 通过节点,边和属性的图的格式存储数据,图克服了其他数据库无法解决的大而复杂的数据难题。 与传统的RDBMs和新的大数据产品相比,图数据库有着明显的优势。 图数据库的主要优点 更好,更快速的查询和分...

0
0
发表了博客
2012/05/24 07:46

【转】Spark,一种快速数据分析替代方案

Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。 Spark 是在 Scala 语言中实现的,它将 Scala 用作其应用程序框架。与 Hadoop 不同,Spark 和 Scala 能够紧密集成,其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集...

0
2
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页