QuestionAnsweringSystem是一个Java实现的人机问答系统,能够自动分析问题并给出候选答案。IBM人工智能计算机系统"沃森"(Watson)在2011年2月美国热门的电视智力问答节目"危险边缘"(Jeopardy!)中战胜了两位人类冠军选手,QuestionAnsweringSystem就是IBM Watson的Java开源实现。
系统架构如下:
工作原理:
1、判断问题类型(答案类型),当前使用模式匹配的方法,将来支持更多的方法,如朴素贝叶斯分类器。 2、提取问题关键词。 3、利用问题关键词搜索多种数据源,当前的数据源主要是人工标注的语料库、谷歌、百度。 4、从搜索结果中根据问题类型(答案类型)提取候选答案。 5、结合问题以及搜索结果对候选答案进行打分。 6、返回得分最高的TopN项候选答案。
目前支持5种问题类型(答案类型):
1、人名 如: APDPlat的作者是谁? APDPlat的发起人是谁? 谁死后布了七十二疑冢? 2、地名 如: “海的女儿”是哪个城市的城徽? 世界上流经国家最多的河流是哪一条? 世界上最长的河流是什么? 汉城是哪个国家的首都? 3、机构团体名 如: BMW是哪个汽车公司制造的? 长城信用卡是哪家银行发行的? 美国历史上第一所高等学府是哪个学校? 4、数字 如: 全球表面积有多少平方公里? 撒哈拉有多少平方公里? 北京大学占地多少平方米? 撒哈拉有多少平方公里? 5、时间 如: 大庆油田是哪一年发现的?
评论