微软开源了 Bing 搜索背后的关键算法

xplanet
 xplanet
发布于 2019年05月16日
收藏 106

微软刚刚宣布开源一项 Bing 搜索背后的关键算法——SPTAG,它使 Bing 能够快速将搜索结果返回给用户。

仅在几年前,网络搜索很简单,用户输入几个关键词并浏览结果页面。 今天,相同的用户可能会在手机上拍照并将其放入搜索框中,或使用智能助手提问,而无需亲自触摸设备。他们也可能会输入一个问题并期待一个实际的答复,而不是一个可能答案的页面列表。

SPTAG (Space Partition Tree And Graph)是分布式近似最近邻域搜索(ANN)库,为大规模矢量搜索场景提供高质量矢量索引构建、搜索和分布式在线服务工具包。利用 SPTAG 算法作为开源 Python 库的核心,Bing 能够在几毫秒内搜索数十亿条信息。

当然,矢量搜索本身并不是一个新想法,微软所做的是将这一概念应用于深度学习模型。

首先,团队采用预先训练的模型并将数据编码到矢量中,其中每个矢量代表一个字或像素。然后使用新的 SPTAG 库生成向量索引。随着查询信息的进入,深度学习模型将该文本或图像转换为向量,该库紧接着就能在索引中找到最相关的向量。

微软表示,SPTAG 库迄今已对超过 1500 亿条数据进行了编目,包括单个单词、字符、网页代码段和完整查询。

“Bing 每天处理数十亿个文档,现在的想法是将这些条目表示为向量,并搜索这个 1000 亿以上向量的巨大索引,以便在 5 毫秒内找到最相关的结果”。

Bing 团队期望开源 SPTAG 可用于构建可识别基于音频片段所说语言的应用,或用于让用户拍摄植物照片并识别属和物种的服务。

该库现已开放使用,并提供构建和搜索这些分布式矢量索引的所有工具。

参考:TechCrunchventurebeat

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 OSCHINA 社区 [http://www.oschina.net]
本文标题:微软开源了 Bing 搜索背后的关键算法
加载中

精彩评论

xiaose1205
xiaose1205
百度准备升级了
冲冠一怒为红薯
冲冠一怒为红薯
微软最近开源上瘾了。。。
ZigzagV
ZigzagV
最近每天都有微软的新闻。。。 微软信仰中心不断得到充值。😂
堂风
赞👍
我没有抓狂
我没有抓狂
微软🐮🍺

最新评论(30

大賢者
大賢者
微软要石更了😯
张豪飞
张豪飞
以前闭源要命,现在开源不要命!
触及天空
我记得以前必应搜索不支持标点符号,搜C++会变成C
冰镇阳的光
冰镇阳的光
百度:是时候升级了
k
keep_wan

引用来自“xiaose1205”的评论

百度准备升级了
百度现在在头疼股价
夙歆风
夙歆风
微软底蕴深厚啊
s
sean9468
bing 挺好,用了很久了,设为了默认搜索引擎。
有课学
有课学

引用来自“xiaose1205”的评论

百度准备升级了
哈哈哈~百度最近担心的是股价~
Percy-Dreams
Percy-Dreams

引用来自“liaoxuewei”的评论

bing的搜索结果跟google差距很大,甚至不如百度,不知道怎么回事,按理不应该啊

引用来自“Percy-Dreams”的评论

自己意淫的吧,你用什么测试评估的?搜索广告csdn确实百度厉害,但是站在综合性上来看,我觉得bing出的结果一点不比百度差。我使用bing近一年了,从来没觉得bing是蹩脚的鸭子。。。

引用来自“liaoxuewei”的评论

不说别的,你就搜索:electron-builder slow,google和bing,我不知道是不是我不会用,bing总是不会优先把包含两个关键词的优先给我。
这有什么意淫的?你意淫吧?
说baidu和bing的对比,没说google
l
liaoxuewei

引用来自“liaoxuewei”的评论

bing的搜索结果跟google差距很大,甚至不如百度,不知道怎么回事,按理不应该啊

引用来自“Percy-Dreams”的评论

自己意淫的吧,你用什么测试评估的?搜索广告csdn确实百度厉害,但是站在综合性上来看,我觉得bing出的结果一点不比百度差。我使用bing近一年了,从来没觉得bing是蹩脚的鸭子。。。
不说别的,你就搜索:electron-builder slow,google和bing,我不知道是不是我不会用,bing总是不会优先把包含两个关键词的优先给我。
这有什么意淫的?你意淫吧?
返回顶部
顶部