2017 机器学习调查报告:Python 最火,R 极具潜力 - 开源中国社区
Float_left Icon_close
2017 机器学习调查报告:Python 最火,R 极具潜力
王练 2017年11月01日

2017 机器学习调查报告:Python 最火,R 极具潜力

王练 王练 发布于2017年11月01日 收藏 25

数据平台 Kaggle 近日发布了 2017 机器学习及数据科学调查报告,这也是 Kaggle 首次进行全行业调查。调查共收到超过 16000 份回复,受访内容包括最受欢迎的编程语言、不同国家数据科学家的平均年龄、不同国家的平均年薪等。

点此查阅完整报告

下面主要看看工具使用方面的结果。请注意,该报告包含多个国家的数据,可能存在收集不够全面的情况,仅供参考。

年龄

从全球范围来看,本次调查对象的平均年龄在 30 岁左右。当然,各个国家的数值会有差异,中国的机器学习从业者年龄的中位数是 25 岁。

全球全职工作者为 65.7% ,其中中国为 53.% ,美国占比较高,达 70.9% 。

Logistic 回归是除了军事和国安领域外,最常用的数据科学研究方法。在军事和国防安全领域,神经网络被使用更多。

在工具语言使用方面,Python是数据科学家使用最多的语言。同时,统计学家对 R 语言的忠诚度很高。

关系型数据是最常用的数据类型,学术研究者和国防安全领域则更亲睐文本和图像。

Git 是他们最常用的代码共享和托管方式。

Dirty Data (脏数据)是从业者遇到的最大障碍。此外,理解不同算法的能力不够也是困扰数据工作者的一大障碍。缺乏有效管理和资金支持,是面临的两大外在困境。

有趣的是,只使用 Python 或只使用 R 的都觉得他们做出了正确的选择。 但是,如果你去询问那些既使用 Python 也使用 R 的人,推荐使用 Python 的可能会是 R 的两倍。

数据科学是个变化极快的领域,业内人员需要不断更新知识体系,才可以在业内保持一定地位,不被时代淘汰。Stack Overflow Q&A、Conferences 和 Podcasts 是已从业者经常使用的学习平台。

更多内容可点此查阅完整报告

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:2017 机器学习调查报告:Python 最火,R 极具潜力
分享
评论(12)
精彩评论
8
平均年龄说明这份统计数据还是很真实的,中国的IT科技近年越来越轻浮化了。
2
奔四的人感觉到了压力
2
人生苦短~~
1
中国很多非计算机非数学类专业的毕业生都转做这个,说明其他行业就业前景堪忧
最新评论
0
一入码农行,从此是光头。
2
奔四的人感觉到了压力
0
其实缺乏资金支持是最大的问题,看看中国有钱人的钱都用到哪里去了!二奶,奢华,电竞,娱乐
1
中国很多非计算机非数学类专业的毕业生都转做这个,说明其他行业就业前景堪忧
0
竟然不是宇宙语言,这不科学
0

引用来自“樱散零乱”的评论

100岁的地方还冒出个头这是什么情况,100岁的长者玩ML?
还有0岁:smirk:
0

引用来自“樱散零乱”的评论

100岁的地方还冒出个头这是什么情况,100岁的长者玩ML?
100岁的长者难道不能make love ?
0
25岁,这批人有好多公司能够雇佣到65的。
0
100岁的地方还冒出个头这是什么情况,100岁的长者玩ML?
2
人生苦短~~
8
平均年龄说明这份统计数据还是很真实的,中国的IT科技近年越来越轻浮化了。
0
平均年龄25岁?老了老了
顶部