精彩博客

InsightFace: 用OneFlow轻松实现超大规模人脸识别模型

概述 人脸识别技术可以准确识别出图像中的人脸和身份,具有丰富的应用场景,譬如金融场景下的刷脸支付、安防场景下的罪犯识别和医学场景下的新冠流行病学调查等等。人脸识别的算法演变经历了以 PCA 为代表的早期阶段,再到以“人工特征+分类器”为主的统计学习方法阶段,近几年,随着大数据及 GPU 算力的爆发,人脸识别进入到深度学习算法为绝对主角的阶段。 人脸识别的规模也从最初基于几百张图片、识别数十张人脸,到现在动辄...

2021/03/03 19:25
3K
0
网易云音乐:基于分布式图学习PGL的推荐系统优化之路

在“精准推荐者得民心”的今天,推荐系统已成为各大互联网公司的标配。但由于现实中很多数据是非欧氏空间生成的(例如,社交网络、信息网络等),一些复杂场景下的业务需求很难通过协同过滤等基于历史行为挖掘用户或产品相似性的传统算法来满足。图神经网络作为一种约束性较少、极其灵活的数据表征方式,在深度学习各主要领域中崭露头角,一系列图学习模型涌现并得到越来越多的应用。 网易云音乐在推荐领域的探索 作为国民级的音...

2021/03/17 19:21
261
0
飞桨框架2.0正式版重磅发布,一次端到端的“基础设施”革新

在人工智能时代,深度学习框架下接芯片,上承各种应用,是“智能时代的操作系统”。近期,我国首个自主研发、功能完备、开源开放的产业级深度学习框架飞桨发布了2.0正式版,实现了一次跨时代的升级。 **这次2.0版本的发布对于飞桨来说,可以说是一次“基础设施”的全面更新换代!**生活中,我们看到过很多基础设施建设工程,例如西电东送、南水北调、高铁建设等等,这些在保证生产生活设施正常运行、推动整个社会的经济发展和人...

2021/03/16 19:15
208
0
百度牵头,全球首个面向商业化运营的Robotaxi技术标准正式发布

近日,由百度牵头,联合交通运输部公路科学研究院、湖南湘江智能、上海淞泓、信通院、威马、东风、一汽、北汽、博世、大唐电信等机构共同起草的Robotaxi技术要求团体标准正式发布。该标准发布后,将规范Robotaxi在安全、体验、运营、测试等关键领域的执行要求,进一步加快Robotaxi的规模化应用,加速高级别自动驾驶技术迈向商业化。 此次发布的标准包括《自动驾驶出租车 第1部分:车辆运营技术要求》和《自动驾驶出租车 第2部分...

2021/02/02 17:38
152
0
“黑科技”RDMA如何帮助深度学习模型优化通信网络?

很多人有疑问:为什么深度学习模型需要优化通信网络? 事实上,越是高性能算力的平台,越离不开通信网络的优化。近日,OneFlow创始人袁进辉与熊先奎先生(中兴通讯股份有限公司无线首席架构师)、宋庆春先生(国际高性能计算和人工智能咨询委员会亚太区主席)在《中兴通讯技术》上联合发表署名论文,探讨关于深度学习中通信网络优化的相关课题。让我们先来一起速读这篇论文的“精华”吧。 深度学习模型为何需要通信网络优化? ...

2020/12/08 14:45
743
0
CUDA 有 unified memory 还需要内存优化吗?

CUDA 有 unified memory 还需要内存优化吗? 先说结论,不管有没有 unified memory,只要有性能要求的软件,都必需自己做优化。 因为 unified memory 的主要工作,并不是去掉了 Host Memory 与 Device Memory 之间的拷贝,而是将原有的需要人工手写的这部分代码,交给了运行时,使得这些工作对程序员透明,但是 Host2Device、Device2Host 的内存拷贝所造成的 overhead 依然存在。 其次,“内存优化”其实是一个非常宽泛的话题,...

2020/12/08 14:44
272
0
【深度学习】— 各框架分布式训练简介+测评

【深度学习】— 各框架分布式训练简介+测评 1.各框架分布式简介 1.Pytorch 从官方文档上我们可以看到,pytorch的分布式训练,主要是torch.distributed包所提供,主要包含以下组件: Distributed Data-Parallel Training (DDP) RPC-Based Distributed Training (RPC) Collective Communication (c10d) 其中,DDP提供了数据并行相关的分布式训练接口;RPC提供了数据并行之外,其他类型的分布式训练如参数服务器模式、pipeline并行...

2020/12/08 14:44
5.6K
0

没有更多内容

加载失败,请刷新页面

没有更多内容

见鬼了!我家的 WiFi 只有下雨天才能正常使用...

这是作者大学时期在家里遇到的一个非常奇怪的网络问题,作者的父亲是一名经验丰富的网络工程师,他们家里使用了一个复杂的网络设置,通过 Wi-Fi 桥接的方式,将父亲公司的高速商业网络连接到...

2024/04/22 10:01
2.1W
0
OpenCV实战:从图像处理到深度学习的全面指南

本文深入浅出地探讨了OpenCV库在图像处理和深度学习中的应用。从基本概念和操作,到复杂的图像变换和深度学习模型的使用,文章以详尽的代码和解释,带领大家步入OpenCV的实战世界。 1. OpenC...

2023/08/02 10:20
1.2W
1
自然语言处理十大应用

作者|ABHISHEK SHARMA 编译|VK 来源|Analytics Vidhya 介绍 自然语言处理是数据科学领域最热门的课题之一。公司在这一领域投入大量资金进行研究。每个人都在努力了解自然语言处理及其应用,并...

2020/07/16 12:57
2.8W
1
案例分享 | ElasticDL:同时提升集群利用率和研发效率的分布式深度学习框架

本文同步发布在 TensorFlow 微信公众号、知乎 SQLFlow 专栏,获得作者授权在开源中国发布,原作者为蚂蚁集团 齐俊、王益 ElasticDL 是一个基于 TensorFlow 2.x 和 Kubernetes 的开源的分布式...

2020/07/09 13:44
1.1W
3
使用Kubeflow构建机器学习流水线

在此前的文章中,我已经向你介绍了Kubeflow,这是一个为团队设置的机器学习平台,需要构建机器学习流水线。 在本文中,我们将了解如何采用现有的机器学习详细并将其变成Kubeflow的机器学习流...

2020/06/19 19:47
1.9W
4
机器阅读理解是什么?有哪些应用?终于有人讲明白了

作者:朱晨光 1. 机器阅读理解是什么 机器阅读理解(Machine Reading Comprehension,MRC)是一种利用算法使计算机理解文章语义并回答相关问题的技术。由于文章和问题均采用人类语言的形式,...

2020/06/05 10:48
3.7W
1
无监督学习算法

本文首发自公众号:RAIS,点击直接关注。 前言 本系列文章为 《Deep Learning》 读书笔记,可以参看原书一起阅读,效果更佳。 无监督学习算法 就是无监督的一种学习方法,太抽象,有一种定义...

2020/04/07 14:03
1.5W
2
过拟合和欠拟合

本文首发自公众号:RAIS 前言 本系列文章为 《Deep Learning》 读书笔记,可以参看原书一起阅读,效果更佳。 构建复杂的机器学习算法 上一篇文章中我们介绍了什么叫做机器学习算法极其具体的...

2020/04/01 06:29
1.2W
1
飞桨火力全开,重磅上线3D模型:PointNet++、PointRCNN!

11年前的「阿凡达」让少年的我们第一次戴上3D眼镜,声势浩大的瀑布奔流而下,星罗棋布飘浮在空中的群山,无一不体现着对生命的敬意,妥妥的坐稳了2010年北美、海外、中国和全球票房No.1的宝座...

2020/03/27 20:32
1.5W
0
KTV歌曲推荐-PCA降维+逻辑回归-性别预测及过拟合处理

前言 上一篇使用逻辑回归预测了用户性别,由于矩阵比较稀疏所以会影响训练速度。所以考虑降维,降维方案有很多,本次只考虑PCA和SVD。 PCA和SVD原理 有兴趣的可以自己去研究一下 https://me...

2020/03/06 14:39
1.9W
4
KTV歌曲推荐-逻辑回归-用户性别预测

前言 上一篇写了推荐系统最古老的的一种算法叫协同过滤,古老并不是不好用,其实还是很好用的一种算法,随着时代的进步,出现了神经网络和因子分解等更优秀的算法解决不同的问题。 这里主要说...

2020/03/03 18:51
2.2W
4
利用深度学习实现手绘数据可视化的生成

前一段时间,我开发了Sketchify, 该工具可以把任何以SVG为渲染技术的可视化转化为手绘风格。(参考手绘风格的数据可视化实现 Sketchify) 那么问题来了,很多的chart是以Canvas为渲染技术的...

2020/01/04 09:13
2.1W
8
开源软件商业模式的探讨

声明:我们的开源项目“ Milvus 向量搜索引擎”还处在社会主义初级阶段。以下内容是我们目前对开源工作的摸索,并非最佳实践。 开源许可证 既然我们决定了要开源,第一步便是要选择合适的开源...

2019/10/23 14:06
8.8K
4
开源,基础软件最好的商业模式

Milvus 向量搜索引擎已开源。欢迎大家在 Github 上关注我们。 虽然已经 2019 年,但还是有不少人(甚至是大部分人),一提到“开源”,想到的就是“免费”与“个人开发的业余(低水平)软件”...

2019/10/23 10:36
9.2K
8
运用第一性原理探寻AI本质

文章来源:宜信技术学院|宜信支付结算团队技术分享第二期-支付结算机器学习技术团队负责人 刘创 分享《AI与第一性原理》 分享者:宜信支付结算机器学习技术团队负责人 刘创 原文发布于个人博...

2019/10/23 10:05
1.1W
14
一篇文章看懂自然语言处理——word表示技术的变迁(从bool模型到BERT)

一、背景 自然语言处理就是要让计算机理解人类的语言,至于到目前为止,计算机是否真的理解的人类的语言,这是一个未知之数,我的理解是目前为止并没有懂得人类语言,只是查表给出一个最大概...

2019/09/25 00:12
1.5W
4
机器学习在高德起点抓路中的应用实践

导读:高德地图作为中国领先的出行领域解决方案提供商,导航是其核心用户场景。路线规划作为导航的前提,是根据起点、终点以及路径策略设置,为用户量身定制出行方案。 起点抓路,作为路线规...

2019/07/16 14:46
5.8K
4
【AI实战】手把手教你文字识别(识别篇:LSTM+CTC, CRNN, chineseocr方法)

文字识别是AI的一个重要应用场景,文字识别过程一般由图像输入、预处理、文本检测、文本识别、结果输出等环节组成。 其中,文本检测、文本识别是最核心的环节。文本检测方面,在前面的文章中...

2019/07/07 16:01
24.6W
24
【AI实战】手把手教你文字识别(检测篇二:AdvancedEAST、PixelLink方法)

自然场景下的文字检测是深度学习的重要应用,在之前的文章中已经介绍过了在简单场景、复杂场景下的文字检测方法,包括MSER+NMS、CTPN、SegLink、EAST等方法,详见文章: 【AI实战】手把手教你...

2019/06/24 22:06
5.5W
19
【AI实战】手把手教你深度学习文字识别(文字检测篇:基于MSER, CTPN, SegLink, EAST等方法)

文字检测是文字识别过程中的一个非常重要的环节,文字检测的主要目标是将图片中的文字区域位置检测出来,以便于进行后面的文字识别,只有找到了文本所在区域,才能对其内容进行识别。 文字检...

2019/05/27 01:30
16.7W
29

没有更多内容

加载失败,请刷新页面

网易云音乐:基于分布式图学习PGL的推荐系统优化之路

在“精准推荐者得民心”的今天,推荐系统已成为各大互联网公司的标配。但由于现实中很多数据是非欧氏空间生成的(例如,社交网络、信息网络等),一些复杂场景下的业务需求很难通过协同过滤等基于历史行为挖掘用户或产品相似性的传统算法来满足。图神经网络作为一种约束性较少、极其灵活的数据表征方式,在深度学习各主要领域中崭露头角,一系列图学习模型涌现并得到越来越多的应用。 网易云音乐在推荐领域的探索 作为国民级的音...

2021/03/17 19:21
261
0
飞桨框架2.0正式版重磅发布,一次端到端的“基础设施”革新

在人工智能时代,深度学习框架下接芯片,上承各种应用,是“智能时代的操作系统”。近期,我国首个自主研发、功能完备、开源开放的产业级深度学习框架飞桨发布了2.0正式版,实现了一次跨时代的升级。 **这次2.0版本的发布对于飞桨来说,可以说是一次“基础设施”的全面更新换代!**生活中,我们看到过很多基础设施建设工程,例如西电东送、南水北调、高铁建设等等,这些在保证生产生活设施正常运行、推动整个社会的经济发展和人...

2021/03/16 19:15
208
0
InsightFace: 用OneFlow轻松实现超大规模人脸识别模型

概述 人脸识别技术可以准确识别出图像中的人脸和身份,具有丰富的应用场景,譬如金融场景下的刷脸支付、安防场景下的罪犯识别和医学场景下的新冠流行病学调查等等。人脸识别的算法演变经历了以 PCA 为代表的早期阶段,再到以“人工特征+分类器”为主的统计学习方法阶段,近几年,随着大数据及 GPU 算力的爆发,人脸识别进入到深度学习算法为绝对主角的阶段。 人脸识别的规模也从最初基于几百张图片、识别数十张人脸,到现在动辄...

2021/03/03 19:25
3K
0
百度牵头,全球首个面向商业化运营的Robotaxi技术标准正式发布

近日,由百度牵头,联合交通运输部公路科学研究院、湖南湘江智能、上海淞泓、信通院、威马、东风、一汽、北汽、博世、大唐电信等机构共同起草的Robotaxi技术要求团体标准正式发布。该标准发布后,将规范Robotaxi在安全、体验、运营、测试等关键领域的执行要求,进一步加快Robotaxi的规模化应用,加速高级别自动驾驶技术迈向商业化。 此次发布的标准包括《自动驾驶出租车 第1部分:车辆运营技术要求》和《自动驾驶出租车 第2部分...

2021/02/02 17:38
152
0
“黑科技”RDMA如何帮助深度学习模型优化通信网络?

很多人有疑问:为什么深度学习模型需要优化通信网络? 事实上,越是高性能算力的平台,越离不开通信网络的优化。近日,OneFlow创始人袁进辉与熊先奎先生(中兴通讯股份有限公司无线首席架构师)、宋庆春先生(国际高性能计算和人工智能咨询委员会亚太区主席)在《中兴通讯技术》上联合发表署名论文,探讨关于深度学习中通信网络优化的相关课题。让我们先来一起速读这篇论文的“精华”吧。 深度学习模型为何需要通信网络优化? ...

2020/12/08 14:45
743
0
CUDA 有 unified memory 还需要内存优化吗?

CUDA 有 unified memory 还需要内存优化吗? 先说结论,不管有没有 unified memory,只要有性能要求的软件,都必需自己做优化。 因为 unified memory 的主要工作,并不是去掉了 Host Memory 与 Device Memory 之间的拷贝,而是将原有的需要人工手写的这部分代码,交给了运行时,使得这些工作对程序员透明,但是 Host2Device、Device2Host 的内存拷贝所造成的 overhead 依然存在。 其次,“内存优化”其实是一个非常宽泛的话题,...

2020/12/08 14:44
272
0
【深度学习】— 各框架分布式训练简介+测评

【深度学习】— 各框架分布式训练简介+测评 1.各框架分布式简介 1.Pytorch 从官方文档上我们可以看到,pytorch的分布式训练,主要是torch.distributed包所提供,主要包含以下组件: Distributed Data-Parallel Training (DDP) RPC-Based Distributed Training (RPC) Collective Communication (c10d) 其中,DDP提供了数据并行相关的分布式训练接口;RPC提供了数据并行之外,其他类型的分布式训练如参数服务器模式、pipeline并行...

2020/12/08 14:44
5.6K
0

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部