高手问答第 283 期 —— 机器学习/深度学习系统的演进与实践

OSC哒哒 发布于 2022/05/23 19:01
阅读 5K+
收藏 3

随着大模型、大计算、大数据的趋势到来,AI的发展进入“软件2.0”新阶段,原有的机器学习/深度学习系统已无法满足当下应用场景的需求。为了适配算法工程师、数据科学家们的需要,近年来,这一领域的技术从软件系统到硬件架构出现了很多新的有趣的探索和革新。

尤其地,机器学习/深度学习系统作为人工智能时代的“操作系统”,其对上层模型设计和应用有着决定性影响,并且相关技术也在不断收敛,不过,国内关于这一领域的相关实践和学习资料较为稀少,因此,本次“高手问答”栏目邀请了一流科技OneFlow创始人&袁进辉 @OneFlow深度学习框架 ,他将交流、分享相关技术发展,希望对从事或想要了解机器学习/深度学习系统相关研究方向/工程实践/知识结构的朋友有所帮助。

OSCHINA 本期高手问答 (5 月 24 日 - 5 月 30 日) 可讨论的内容包括:

  • 各类AI系统的架构设计特色
  • 硬件体系结构/编译器的技术特点
  • 模型的训练和部署
  • 机器学习/深度学习/MLOps技术内容
  • AI商业化和应用落地现状
  • 从事AI系统架构师/工程师的知识结构
  • 工程师职业选择问题

或者其它“机器学习/深度学习系统的演进和实践”相关问题,也欢迎大家积极提问!

嘉宾简介

袁进辉,一流科技OneFlow创始人&CEO,清华大学计算机系博士,中关村数智人工智能产业联盟副理事长,之江实验室天枢开源AI平台架构师。

他曾在网易、微软担任研究员,做过包括AI、计算神经科学研究等多种类型的工作,也曾参与和主导多个创业项目。2013年,他加入微软亚洲研究院从事大规模机器学习平台研发,2014年发明了当时世界上最快的主题模型训练算法系统LightLDA,被微软研究院全球副总裁周以真称为“年度最好成果”。2015年专注搭建基于异构集群的深度学习平台,获微软亚洲研究院院长特别奖。袁博士曾在计算机视觉及多媒体领域顶级会议发表多篇论文,连续多年获得美国国家技术标准局的视频检索评测比赛第一名。

OneFlow相关账号:

开源中国:OneFlow深度学习框架,https://my.oschina.net/oneflow

GitHub:https://github.com/Oneflow-Inc/oneflow/

微博:https://weibo.com/u/6433304918

知乎:https://www.zhihu.com/org/oneflow-17

为了鼓励踊跃提问,@OneFlow深度学习框架 将在问答结束后从提问者中抽取 3 名幸运用户各赠予定制 T 恤 一件。

OSChina 高手问答一贯的风格,不欢迎任何与主题无关的讨论和喷子。

下面欢迎大家就 “机器学习/深度学习系统的演进与实践”相关的问题 @袁进辉 老师提问,请直接回帖提问。

加载中
0
OSC哒哒
OSC哒哒

高手问答第 283 期 —— 机器学习 / 深度学习系统的演进与实践

@zgw06629  @pyboy58 @Endprocess 

恭喜以上三位网友分别获得定制 T 恤 一件。

请于6月16日前登陆账号, 私信  @小白兔爱吃大灰狼   告知快递信息(格式:姓名+电话+地址)

0
zgw06629
zgw06629

@OneFlow深度学习框架 平时工作中大量用到 如 评论观点抽取 OCR识别 关键词抽取等技术 目前主要用的是飞浆(Paddle) 我的问题是 应用为主 怎么站在巨人的肩膀上 选择合适的开源工具完成业务需求 以及 去哪里获取这些信息呢 如知道什么框架技术模型在某一细分领域效果最佳

OneFlow深度学习框架
OneFlow深度学习框架
如果试验的成本比较高,可以参考同行的意见,譬如看同行评审的论文怎么评价,看GitHub上的star,fork等指标作为参考,也可以在知乎、公众号、开源中国等技术社区看大家怎么评价。纸上得来终觉浅,绝知此事要躬行。如果有好几个框架技术都满足自己的需求,都试一试就知道了。 Paddle有一些比较成熟的模型库很不错,OneFlow在CV、NLP、广告推荐等领域也实现了很多SOTA模型,可以试试怎怎样。
0
shmilytsui
shmilytsui

@OneFlow深度学习框架 老师您好! 我的问题是:AI作为一种新的技能,涉及到很多底层的技术和应用,那么与哪些领域相结合其落地的效果最好?AI一般充当什么角色效果最佳?谢谢!

OneFlow深度学习框架
OneFlow深度学习框架
回复 @OneFlow深度学习框架 : 有了AI来做数据驱动的编程,我们可以更好、更快地将物理世界映射到计算机里,有些无法通过人工编程解决的问题,可以通过收集大量的数据用AI自动从数据种训练出模型来解决,这就是AI的核心价值。业界把这种数据驱动编程的变革称为“软件2.0”,用来代替由人脑驱动的“软件1.0”。国外的许多投资机构预测,软件2.0会创造比PC和移动互联网时代大得多的社会价值与商业价值
OneFlow深度学习框架
OneFlow深度学习框架
回复 @OneFlow深度学习框架 : 预测蛋白质结构的AlphaFold、自动“写”代码还能打败50%人类程序员的AlphaCode,以及模拟托克马克装置控制等离子的形状和运动等等。可以说,科学研究领域,AI for Science起到了极大的加速作用,带来了革命性的范式。
OneFlow深度学习框架
OneFlow深度学习框架
我们可以看到AI在很多场景创造了价值,比如互联网和移动互联网的内容推荐与广告推荐、自动驾驶、医疗影像诊断、在语音识别领域、语音识别和语音助手、机器翻译、考古、写作、绘画、虚拟人等等,这些都是大家耳熟能详的应用场景了。国外有个公司叫DeepMind,他们对于AI的落地应用做出很多前瞻性的、新颖的尝试,譬如非常著名的、击败了多名世界冠军的围棋模型AlphaGo、可以打星际等对战游戏的AlphaStar
0
Endprocess
Endprocess

@OneFlow深度学习框架 低代码/无代码的发展是否能够帮助MLOPS的发展?谢谢

OneFlow深度学习框架
OneFlow深度学习框架
会,而且MLOps的一个发展方向也是低代码/无代码,也就是把足够通用且能自动完成的环节都会沉淀下来形成标准化的模块,形成MLOps的一部分,用户只需要简单的调用或者拖拉拽的方式进行组合即可完成任务。我认为,AI标准化、普惠化是一个必然趋势,低代码/无代码化有助于这一目标的实现。
0
S
ShawnSiao

@OneFlow深度学习框架 关注到T恤上有一行字,“让AI无处不在”。AI真的可以无处不在吗?无处不在的话是否会带来隐私或者其他方面的隐患?我们需要的是让AI带来方便,给人类带来方便帮助,应该怎么处理帮助和隐患的度呢?

S
ShawnSiao
回复 @OneFlow深度学习框架 : 感谢老师的解答!
OneFlow深度学习框架
OneFlow深度学习框架
您对AI无处不在之后对人类隐私隐患的顾虑是成立的,事实上现在已经发生了一些不好的事情。我个人是乐观派,我认为技术本身是中性的,它会起正面还是反面的影响取决于人们怎么去使用它。所幸,已经看到了很多从业者和政府也注意到了这一问题,而且在提出很多种可能的解决办法,譬如加强数据监管,或者通过联邦学习、隐私计算等技术手段来解决。我不是这方面的专家,很期待这些问题得到解决。
OneFlow深度学习框架
OneFlow深度学习框架
回复 @OneFlow深度学习框架 : 深度学习能大大加速现实世界往虚拟世界迁移的进程。这是AI和数据驱动的技术带来的最本质进步,AI绝对是能载入科技史册的技术进步。 特斯拉人AI负责人Andrej Karpathy,他在17年写了篇博客叫《Software 2.0》。他的观点,以前是软件1.0,也就是所有软件都要人写,但现在2.0可以用数据编程的方式来做。训练神经网络的权重,本质就是在编程。
OneFlow深度学习框架
OneFlow深度学习框架
回复 @OneFlow深度学习框架 : 回想一下在深度学习之前,一位人工智能的研究生要学习多少种算法,支持向量机、决策树、隐马尔可夫模型、马尔科夫随机场等等,每个算法背后都有自己的一套数学方法,每个领域都有自己的最有效算法。到今天,基本所有领域,SOTA算法都是神经网络,而神经网络背后都是BP算法。 所以神经网络和深度学习的厉害之处,在于标准化一统天下。标准还在发生,不同领域的神经网络结构也在趋同
OneFlow深度学习框架
OneFlow深度学习框架
我认为,AI真的可以无处不在。在 https://mp.weixin.qq.com/s/97nlRYyYwusj9eOQPSS5aw 这里分享过一些观点,这里再摘录一下。
0
iman123
iman123

@OneFlow深度学习框架 老师,您好,对于机器学习、深度学习,我也是知之甚少,也想好好学习学习,不过这方面似乎有很多的框架、类库,例如Tensorflow、Pytorch、PaddlePaddle 等,OneFlow与这些相比有什么不同,我应该如何快速系统性的学习和实践机器学习、深度学习这方面的技能?

OneFlow深度学习框架
OneFlow深度学习框架
快速系统性学习AI的最好方式是看教程,网上有很多免费课程,比如CS231n等,实践的话当然是尝试通过OneFlow这样的框架来动手实现一些项目,在学中练,在练中学。
OneFlow深度学习框架
OneFlow深度学习框架
OneFlow独创了自动数据模型混合并行、静态调度、去中心化和全链路异步流式执行四大核心技术,完美解决了大数据、大模型、大计算所带来的异构集群分布式扩展挑战,打破“内存墙”的限制。相对于其它深度学习框架,OneFlow最大的特色是横向扩展性强,硬件利用率和系统加速比高,更重要的是,只用一套机制就可以支持数据并行、模型并行和流水并行等并行模式。
0
南方Go
南方Go

@OneFlow深度学习框架  1. OneFlow 采用什么样的架构设计,显得他的架构比其他同类框架tensorFlow,tourch优秀呢?    2 . oneflow在广告推荐算法领域有没有什么比较好的公司工业实践, 可以谈谈你的心得吗?  3.  想咨询下面试深度学习相关岗位事,怎么突出自己的技术优势和学习了oneflow框架的新知识优势?比如面试的公司是使用tensoflow等老牌框架,怎么突出oneflow优势?

OneFlow深度学习框架
OneFlow深度学习框架
3、目前,OneFlow已经基本兼容PyTorch框架,单卡易用性已经与之对齐,也就是说,当你学习了OneFlow之后,就有了比别人更丰富的分布式训练经验,而且顺便也会对PyTorch框架机制有比较深入的了解。
OneFlow深度学习框架
OneFlow深度学习框架
2、推荐方面,OneFlow能实现大型推荐系统引擎,速度快过HugeCTR,目前已有大型互联网公司使用
OneFlow深度学习框架
OneFlow深度学习框架
1、OneFl独创了自动数据模型混合并行、静态调度、去中心化和全链路异步流式执行四大核心技术,完美解决了大数据、大模型、大计算所带来的异构集群分布式扩展挑战,打破“内存墙”的限制。相对于其它深度学习框架,OneFlow最大特色是横向扩展性强,硬件利用率和系统加速比高,主要是因为用一套简洁抽象(SBP + Actor)在支持各种模型并行、混合并行、流水并行、自动并行、ZeRO等非常简单高效。
0
贺小皮蛋
贺小皮蛋

@OneFlow深度学习框架 老师我问一个天马行空的问题,AI到底是替代人的思考,还是协助人的思考,会不会出现那种超级电脑,拒绝人为指令的情况(脑袋太大了,科幻片思维),

0
Cobbage
Cobbage

@OneFlow深度学习框架 老师,您好。我是学Java的想换个方向,最近在学python opencv,但是数学知识已经忘完了 可以给我提点建议不?

osc_47642901
osc_47642901
1111111
Cobbage
Cobbage
回复 @pyboy58 : 谢了
南方Go
南方Go
pythom 敲错了 Python, Python调opencv应该不难,但是opencv用c++的挺多的,数学知识很重要,否则很多算法难以调优,具体可以找点视频看看,一般搞算法的都是研究生起步哈
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部