Stack Overflow 引入 CROKAGE,搜问题不用再东拼西凑

h4cd
 h4cd
发布于 2019年08月20日
收藏 14

许多开发者使用 Stack Overflow 搜索开发中遇到的问题,有时候需要查询的结果中有通俗的讲解,而且最好还能够带上代码 demo,但是两者同时很完美地满足要求还是比较困难的。不过最近 Stack Overflow 官方博客上介绍了一种智能化的技术,或许可以解决这一问题。

新技术名叫 CROKAGE(Crowd Knowledge Answer Generator,群众知识答案生成器),它来源于今年早些时候一个计算机科学研究小组发表的一篇论文,CROKAGE 可以将提问作为查询,然后返回相关的、全面的编程解决方案,所谓全面,就是说它不仅有代码片段,还包括简洁的自然语言解释,这样开发者就不用在众多的答案中拼凑出一个解决方案。

CROKAGE 使用 Stack Overflow 上的数百万个 Q&A 作为训练语料库进行训练,还扩展了自然语言查询(任务描述),包括从 Stack Overflow 中仔细挖掘出来的独特的开源软件库和功能术语。

对于返回来的候选答案,研究人员组合了四个加权因子进行排序,他们利用传统的信息检索(IR)指标,如 TF-IDF 和非对称相关性,同时为了适应 Stack Overflow 的环境,还采用了非常适合软件特定文档的针对性排序机制。

简单来讲,整个运作机制如前边的图片所示,主要分为几个步骤:

  • A、语料库准备
  • B、构建模型,map、索引
  • C、搜索相关答案
  • D、整合编程解决方案

研究团队还对结果进行了对比,如下图所示,在对比中,CROKAGE 给出的建议答案中,代码示例的相关性、代码解释的清晰度以及整体解决方案的质量(也就是代码+解释的整体质量),比目前最先进的工具产出了更好的结果。

目前 CROKAGE 还有一些局限性,比如它仅支持 Java 语言的相关查询,而且如果问题描述比较差,那工具也无法给出如何改进的建议。

开发者可以通过 http://www.isel.ufu.br:9000 体验该功能。

关于该功能的更多信息,查看:

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 OSCHINA 社区 [http://www.oschina.net]
本文标题:Stack Overflow 引入 CROKAGE,搜问题不用再东拼西凑
加载中

精彩评论

Raphael_goh
Raphael_goh
你没看最后一段只支持Java吗

最新评论(7

开源中国首席罗纳尔多
开源中国首席罗纳尔多
中文问题在上面找,要先gooogle翻译成英文吗?
z
zjh6
人工智能就是忽悠.一堆垃圾数据.
iman123
iman123
刚试了一个"javascript regex not start with",一个结果都不正确,还有待提高,没有例如google搜索出来的结果好
Raphael_goh
Raphael_goh
你没看最后一段只支持Java吗
iman123
iman123
嗯,现在注意到了,谢谢提醒
申君健
申君健
@红薯 说,已经做好了,你看动弹不就是”Crowd Knowledge Answer Generator,群众知识答案生成器!”
CielSwift
CielSwift
开源中国可以做吗?
返回顶部
顶部