高手问答第 142 期 — TensorFlow 实战

局长 发布于 2017/02/20 07:08
阅读 9K+
收藏 40

OSCHINA本期高手问答( 2017 年 2 月 20 日 - 2 月 26 日) 我们请来了@黄文坚 @唐源Terry 为大家解答关于 TensorFlow 方面的问题。

黄文坚,PPmoney 大数据算法总监,负责集团的风控、理财、互联网证券等业务的数据挖掘工作。Google TensorFlow Contributor。前明略数据技术合伙人,领导了对诸多大型银行、保险公司、基金的数据挖掘项目,包括建立金融风控模型、新闻舆情分析、保险复购预测等。曾就职于阿里巴巴搜索引擎算法团队,负责天猫个性化搜索系统。曾参加阿里巴巴大数据推荐算法大赛,于 7000 多支队伍中获得前 10 名。本科、研究生就读于香港科技大学,曾在顶级会议和期刊 SIGMOBILE MobiCom、IEEE Transactions on Image Processing 发表论文,研究成果获美国计算机协会移动计算大会(MobiCom)最佳移动应用技术冠军,并获得两项美国专利和一项中国专利。

唐源,目前在芝加哥的 Uptake 公司带领团队建立用于多个物联网领域的数据科学引擎进行条件和健康监控,也建立了公司的预测模型引擎,现在被用于航空、能源等大型机械领域。一直活跃在开源软件社区,是 TensorFlow 和 DMLC 的成员,是 TensorFlow、XGBoost、MXNet 等软件的 committer,TF.Learn、ggfortify 等软件的作者,以及 caret、pandas 等软件的贡献者。曾获得谷歌 Open Source Peer Bonus,以及多项高校和企业编程竞赛的奖项。在美国宾州州立大学获得荣誉数学学位,曾在本科学习期间成为创业公司 DataNovo 的核心创始成员,研究专利数据挖掘、无关键字现有技术搜索、策略推荐等。

自 TensorFlow 于 2015 年底正式开源,距今已有一年多,这期间 TensorFlow 不断给人以惊喜,推出了分布式版本,服务框架 TensorFlow Serving,可视化工具 TensorFlow,上层封装 TF.Learn,其他语言(Go、Java、Rust、Haskell)的绑定、Windows 的支持、JIT 编译器 XLA、动态计算图框架 Fold,以及数不胜数的经典模型在 TensorFlow 上的实现(Inception Net、SyntaxNet 等)。在这一年多时间,TensorFlow 已从初入深度学习框架大战的新星,成为了几近垄断的行业事实标准。

在近日 Mountain View 举办的首届年度 TensorFlow 开发者峰会上,Google 发布了 TensorFlow 1.0,新版本更快、更灵活、更便于开发、保证了 Google 的机器学习库的 API 稳定性。希望本期问答对入门 TensorFlow 和深度学习的研究者起到帮助!

为了鼓励踊跃提问,@博文视点  会在问答结束后从提问者中抽取 5 名幸运会员赠予《TensorFlow实战》一书。

购买链接:https://item.jd.com/12125568.html?dist=jd

OSChina 高手问答一贯的风格,不欢迎任何与主题无关的讨论和喷子。

下面欢迎大家就 TensorFlow 方面问题向 @黄文坚 @唐源Terry 提问,请直接回帖提问。

加载中
0
博文视点
博文视点

OSC 第 142 期高手问答 -- TensorFlow实战

@Li_Peng  @sca7  @灵风fly  @golang  @tinyhare  

恭喜以上五位网友或获得《TensorFlow实战》图书一本 

请私信 @博文视点   告知快递信息(格式:姓名+电话+地址)! 
 

0
Li_Peng
Li_Peng

@黄文坚 您好,我想问一下TensorFlow和Spark结合的框架,例如TensorFlow on Spark,目前是否已经成熟可用?另外,TensorFlow新版本增加了对Java API的支持,如果不使用python语言,所有功能都直接使用Java语言进行相关开发是否已经可行?谢谢!

Li_Peng
Li_Peng
回复 @黄文坚 : 感谢回复,让我可以在选型上少走一些弯路,谢谢。
黄文坚
黄文坚
回复 @Li_Peng : 目前TensorFlow的分布式算是比较成熟的,但可能还不是最快的。TensorFlowonSpark应该不能提升分布式的性能,毕竟还经过了一层spark的通信机制处理。
Li_Peng
Li_Peng
回复 @唐源Terry : 感谢回复,请问使用TensorFlowOnSpark之后,除了免去数据在hdfs和TensorFlow移动之外,是否能对性能有较好的提升呢?如果不用TensorFlowOnSpark,TensorFlow目前自己的分布式性能是否已经成熟了呢?谢谢。
唐源Terry
唐源Terry
Java api目前还不太成熟,很多还有待实现,TensorFlowOnSpark也挺有意思的,可以在现有的Spark/Hadoop分布式集群的基础上部署TensorFlow的程序,这样可以避免数据在已有Spark/Hadoop集群和深度学习集群间移动,HDFS里面的数据能够更好的输入进TensorFlow的程序当中。至于成熟不成熟我就不清楚了,毕竟自己还没有试过,不过稍微看了看雅虎自己有使用。
0
榕树下_
榕树下_

居然没找到收藏按钮

凝小紫
凝小紫
标题左侧哦
0
震秦
震秦

@黄文坚 你好。TF 现在很热,我了解 TF 也有一段时间了,感觉很多领域真要去做的话,信息的量化并不容易。还有就是,想要深入学习怎么入手? 里面的很多概念不是容易懂。

唐源Terry
唐源Terry
首先要了解一些主要的机器学习深度学习算法,看看大概都是怎么运用的,然后看看TF的基础,多看点例子理解一下,最好的方法就是看我们这本《TensorFlow实战》(注意黑白封面),里面很多例子帮助理解 !
0
Ryan-瑞恩
Ryan-瑞恩

@黄文坚 就我本身,对其他的一些机器学习的库接触过一些,要出一个好的效果,对算法选取和参数设置及调节这些方面,希望你能给些建议。算法比较多,该如何从分析维度去选取合适的算法?

Ryan-瑞恩
Ryan-瑞恩
回复 @唐源Terry : 感谢作者回复。
黄文坚
黄文坚
对于一般的数值、种类等特征的数据集,xgboost和lightgbm都有很好的效果。如果你的数据量很大,或者是图片、视频、语音、语言、时间序列,那么使用深度学习将能获得很好的效果。
唐源Terry
唐源Terry
我觉得最好的方法就是参加数据科学竞赛,比如说Kaggle,通过融入在大家的讨论当中,实际操作和锻炼,你可以很快的理解各种参数的意义和一些比较好的参数范围。
0
5G加ios
5G加ios

@黄文坚TensorFlow在大数据行业的应用和运用怎么样? TensorFlow的源码使用了哪些设计模式?

黄文坚
黄文坚
Google内部非常多team在使用tensorflow,比如搜索、邮件、语音、机器翻译等等。数据越大,深度学习效果越好,而支持分布式的tensorflow就能发挥越大的作用。
唐源Terry
唐源Terry
应用非常广的,谷歌已经在很多项目上用了TensorFlow,比如说Youtube watch next,还有很多研究型的项目,谷歌DeepMind以后所有的研究都会使用这个框架。如果对某段代码好奇,可以去参考参考源代码学习学习,很多的设计都是经过内部各种项目和用户的千锤百炼。
0
Leo_Vip
Leo_Vip

@黄文坚 学习TensorFlow需要哪些技术栈,了解tensorflow需要月度源码吗

黄文坚
黄文坚
最底层还有cuda的代码。这个要看你的需求哦,是想了解到什么程度,如果只是用来做应用,想要很快出结果,直接看api就好。如果想对性能进行优化,可能需要阅读源码。
唐源Terry
唐源Terry
如果只是想调用高阶的一些模块做一些应用,基本的python就够了,如果想在某一块做提升的话,能自己学习读代码是再好不过的了,我一开始参与开源软件的时候也是只懂一些基础,可以积极参与开发和讨论,从这个过程中可以学到很多。如果想掌握底层的一些细节,就需要学好c语言之类的了。
0
5G加ios
5G加ios

@黄文坚  tensorflow有在生产企业中应用的案例吗?

黄文坚
黄文坚
在Google用的特别多,所有会用到深度学习的场景,都可以使用TensorFlow,比如搜索、邮件、语音助手、机器翻译、图片标注等等
Ryan-瑞恩
Ryan-瑞恩
案例挺多的,,你可以自己百度一下。但是都没有具体说细节是怎么玩的。
0
t
tanyaobin

@黄文坚 请问,tensorflow 从个体学习研究 到 实际生产环境应用,有哪些注意事项?

黄文坚
黄文坚
个人研究的时候没有太多限制,实际上线生成可以使用TensorFlow Serving,部署效率比较高
0
c
citrus_

@黄文坚 好期待TensorFlow这本书,对于新手看着书入门会有难度吗?要先掌握什么基础知识呢?

黄文坚
黄文坚
对新手难度不高。需要一些基础的Python运用能力,还有一些机器学习基础。书中对深度学习有较多的讲解,所以对深度学习的知识要求不高。
Ryan-瑞恩
Ryan-瑞恩
其实你可以先看看 TF 中文官方站点的文档。
返回顶部
顶部