高手问答第 249 期 —— 机器学习的发展前景如何?

xplanet 发布于 07/12 22:12
阅读 3K+
收藏 6

Linux基金会免费官方培训及考试申请即将截止,戳这里申请!>>>

近几年来,传统互联网发展已略显疲态。如今市场上出现了一个新兴领域,那就是机器学习和数据科学。数据采集和存储,以及对数据的利用成为新的增长点,市场需求快速增长。未来 3~5 年,机器学习发展前景如何?什么是自动机器学习?怎样才能成为一名机器学习工程师呢?

OSCHINA 本期高手问答(2020 年 7 月 13 日——2020 年 7 月 19 日)将围绕【机器学习发展前景】展开探讨。 可讨论的问题包括但不限于:

  • 机器学习就业前景
  • 机器学习有哪些应用,可以解决什么问题?
  • 如何学习机器学习,有哪些入门书?
  • 看不懂机器学习数学公式怎么办?
  • 什么是自动机器学习?
  • 怎样才能成为一名机器学习工程师?

嘉宾简介

马勇,《自动机器学习入门与实践:使用 Python》审校者,驱动开发网创办人,《竹林蹊径 - Windows 驱动开发》作者,奇安信产品线技术总监,北京理工大学人工智能方向博士生。20 年软件研发经验,擅长操作系统内核 ,人工智能在安全软件中的应用等方向,研究方向为基于深度学习的小样本分类。

为了鼓励踊跃提问,华中科技大学出版社会在问答结束后从提问者中抽取 5 名幸运读者随机赠予自动机器学习入门与实践:使用 Python图书 本。

购书地址:http://dwz.date/b24q

OSCHINA 高手问答一贯的风格,不欢迎任何与主题无关的讨论和喷子。

下面欢迎大家向马勇老师 @马勇_znsoft 积极提问,直接回帖提问即可。

加载中
0
xplanet
xplanet

高手问答第 249 期 —— 机器学习的发展前景如何?
@lj_hello_world @laotan @如花如果如落叶 @AmCoder @zhkhuang  
恭喜以上五位网友分别获得图书一本
请私信 @xplanet  告知快递信息(格式:姓名+电话+地址)

0
wha37
wha37

@znsoft   机器学习入门 ,需要什么基础?学习python,要具备什么前提能力?

马勇_znsoft
马勇_znsoft
通常需要一点数学知识,比如高等数据(求导),线性代数(矩阵运算),概率与数理统计等。通常需要研究生水平的线性代数知识(比如矩阵分解等知识,这些课程在矩阵分析中讲授)。 Python是一种比较简单的脚本语言,如果你有其它编程语言知识,比较容易学会。但是由于是人工智能编程,矩阵相关的操作比较多,而且python有很多自己的trick来处理列表处理,比如切片,逆序操作等与其它语言不太一样。
0
源码节点
源码节点

@znsoft  机器学习数学公式很难理解,怎么把公式转化为代码?

马勇_znsoft
马勇_znsoft
公式转换为代码并不难。但是在机器学习中,有一些基础操作,比如方根或者矩阵之间的运算等,有现成的运算符或函数,不需要自己造轮子。作为练习去造轮子是可以的,但是在日常开发中不需要。自己造的论子在优化方面可能不如已经有的函数或库(当然也有例外,作为初学者这种情况比较少)
0
源码节点
源码节点

@znsoft  机器学习有哪些应用?是否可以应用在 服务器安全领域上? 怎么把机器学习应用在安全领域?

马勇_znsoft
马勇_znsoft
机器学习(广义的,包括传统机器学习和深度学习)的主要应用是分类和回归。 分类是其中应用最多的角度。 服务器安全领域使用机器学习比较多,困惑这方面应用的是算力水平。安全行业通常受限于成本,无法运行大规模的模型,无GPU可用。此时,对算力要求不高的机器学习(传统狭义的机器学习,基于特征工程)就变得比较实用了。安全领域的应用主要是数据表征的能力,模型上传统的或者现在sota的模型已经很好了。
0
laotan
laotan

@znsoft 马博士你好,我现在正在采用旁路镜像方式进行网络报文拆包解包,通过一些规则进行分类、分析。计划着通过机器学习技术做一些态势预测、告警预判等功能场景,请问是否可行。另外业务流量因为受外界因素影响较大(比如天气、政策、疫情期间的消费习惯),请问机器学习模型的建立怎么来避免其它因素影响造成误判,请博士指点。

技术栈:TAP设备、DPDK、J2EE、Lua, 如果引入机器学习应该引入什么技术。

laotan
laotan
回复 @马勇_znsoft : 关于机器学习您的团队目前应用在哪些场景,效果怎么样:blush:
马勇_znsoft
马勇_znsoft
对网络流量进行分类是目前安全行业研究的热点。在及时的在线分析中,机器学习算法中资源 消耗较少的svm或其它的集成学习算法使用比较多(算力效率高),深度学习一直是大家的研究热点,但是工程应用比较少。目前我们在尝试的深度学习算法主要是cnn之类的简单模型。机器学习的模型需要经常进行tuning以适配场景变化 。目前热点是机器学习结合传统规则 表示方法,兼顾 规则 的可解释性和机器学习的泛化能力。
0
z
zentel

@znsoft 我想问下机器学习在音频处理(降噪,增益,回声消除等)方面有什么方案吗?

马勇_znsoft
马勇_znsoft
音频方面国较少接触,主要还是表征问题。音频处理后音素作为输入数据,用深度神经网络进行预测与匹配。 你说的方面是传统的音频处理的方向,这方面不熟悉。但是可以设想下,如果对噪声或回声之类转换为音素后再进行消除处理,是不是一个应用方向?
0
开源中国首席罗纳尔多
开源中国首席罗纳尔多

@znsoft 您好,请问机器学习是基于什么原理和理解模型?

马勇_znsoft
马勇_znsoft
AI的原理比较复杂,传统机器学习是对人工特征数据进行模式与划分。人工神经网络主要是通过数据和分层的神经网络单元对任意的函数进行逼近模拟 。人工神经网络目前主要的问题是解释性欠佳,在医学和保险等需要强解释性的行业,人工智能被谨慎使用。在可解释性方面,有不少人在做相关研究。传统的基于人工特征的机器学习的可解释性远大于深度学习,毕竟深度学习主要是端对端模型,设计上人类并不是太在意中间的过程(其实是无力)
0
lj_hello_world
lj_hello_world

@znsoft 年近35,10多年开发经验,主语言C/C++,也会python。现在想转行人工智能,我,还有机会吗

lj_hello_world
lj_hello_world
回复 @马勇_znsoft : 谢谢鼓励,目前已经在学了,学习的方向是了解算法的基本原理,主要是为了了解不同的场景应该对应哪种算法,已经如何设计神经网络FC等,学习的平台是百度飞桨,现在在研究算法已经迟了,我的优势应该是对业务的逻辑抽象和代码的架构设计,您觉得这个思路对吗?
马勇_znsoft
马勇_znsoft
送给你一句我经常激烈自己的话: 种一棵最好的是十年前,其次是现在。学习与努力 ,任何时间都不晚。也许你比20岁进入的年轻人晚,但是你比任何和你一样年纪或比你大的人早。你已经在想了,他们好多人还没有想呢。但是心动不如行动,立即 努力 吧。
0
zerolemon
zerolemon

@znsoft 正在使用python做一些小打小闹的项目,但是总感觉转不到机器学习的相关行业,对于我们这些不属于行业内的人员,如何发展自己的技能,转行成功?只能家居算不算机器学习的行业?

马勇_znsoft
马勇_znsoft
大部分人工智能应用,对现有的模型进行组合与调参即可得到比较好的结果。如果你是想深入,对基础原理与理论的理解是很重要的。我在学习中的心得是:其实你学习的细节的原理在应用中是看不到的(都封装 了),但是可以帮助你理解与选择。 知其然并知所以然才能走得更远。
0
mopland
mopland

@znsoft 做技术的都应该了解 机器学习 吗?或者说 机器学习 对普通程序员未来有多大影响?

马勇_znsoft
马勇_znsoft
也许不需要成为专家,但是一定要理解。这是另一种算法。 传统算法是稳定的,算法中包括所有规则 ,数据进去后出来的结果是可以预测的。机器学习算法的行为受训练的数据影响,不同数据参与训练,得到的模型及参数确定的行为是不一样的。 这是另一种编程方法与思维方式。
返回顶部
顶部