QuestionAnsweringSystem v1.1 发布,人机问答系统

2014年08月06日

QuestionAnsweringSystem是一个Java实现的人机问答系统,能够自动分析问题并给出候选答案。IBM人工智能计算机系统"沃森"(Watson)在2011年2月美国热门的电视智力问答节目"危险边缘"(Jeopardy!)中战胜了两位人类冠军选手,QuestionAnsweringSystem就是IBM Watson的Java开源实现。

系统架构如下:

 

 

工作原理:

1、判断问题类型(答案类型),当前使用模式匹配的方法,将来支持更多的方法,如朴素贝叶斯分类器。
2、提取问题关键词。
3、利用问题关键词搜索多种数据源,当前的数据源主要是人工标注的语料库、谷歌、百度。
4、从搜索结果中根据问题类型(答案类型)提取候选答案。
5、结合问题以及搜索结果对候选答案进行打分。
6、返回得分最高的TopN项候选答案。

 目前支持5种问题类型(答案类型):

1、人名 
    如:
    APDPlat的作者是谁?
    APDPlat的发起人是谁?
    谁死后布了七十二疑冢?
    杨尚川最爱的女人是谁?
2、地名
    如:
    “海的女儿”是哪个城市的城徽?
    世界上流经国家最多的河流是哪一条?
    世界上最长的河流是什么?
    汉城是哪个国家的首都?
3、机构团体名
    如:
    BMW是哪个汽车公司制造的?
    长城信用卡是哪家银行发行的?
    美国历史上第一所高等学府是哪个学校?
    前身是红色中华通讯社的是什么?
4、数字
    如:
    全球表面积有多少平方公里?
    撒哈拉有多少平方公里?
    北京大学占地多少平方米?
    撒哈拉有多少平方公里?
5、时间
    如:
    哪一年第一次提出“大跃进”的口号?
    大庆油田是哪一年发现的?
    澳门是在哪一年回归祖国怀抱的?
    香港是在哪一年回归祖国怀抱的?

项目主页 

可部署war包下载

展开阅读全文
53 收藏
分享
加载中
最新评论 (18)

引用来自“地瓜干”的评论

需要配置问答数据吗,要不然数据从那里来?
不需要配置,默认使用百度搜索引擎作为数据源
2014-08-07 22:45
0
回复
举报

引用来自“axhack”的评论

http://ai.ccpinke.com架了演示,发现查询总失败,而且你提供的war包没api接口。
我刚更新了war包
2014-08-07 22:45
0
回复
举报
需要配置问答数据吗,要不然数据从那里来?
2014-08-06 20:55
0
回复
举报
http://ai.ccpinke.com架了演示,发现查询总失败,而且你提供的war包没api接口。
2014-08-06 20:25
0
回复
举报

引用来自“高东”的评论

哪一年的作者是谁

引用来自“杨尚川”的评论

那些年的作者是谁
呵呵

引用来自“杨尚川”的评论

那些年的作者是九把刀
呵呵呵,我是想知道如果符合两种问题类型或者两种以上类型的问题机器咋回答
2014-08-06 16:12
0
回复
举报
闹心,不支持JDK1.6
2014-08-06 14:57
0
回复
举报
她爱我吗?
2014-08-06 14:18
0
回复
举报
更多评论
18 评论
53 收藏
分享
返回顶部
顶部