2
回答
在人工智能中有没有过程式的语音交互系统?
华为云实践训练营,热门技术免费实践!>>>   

     最近在用百度的语音交互,由于系统做了个安卓app提供些简单的功能,就接入了语音控制,用的百度的免费的语音识别,做了些简单的功能,发现实际挺简单的,复杂点也就在于语音识别这块,不过这个我们也不设计,由百度等专门做,我们用就可以了。

      说简单是说对于一个系统而已,能够使用语音的太简单了,只能够替代一些非常普通的功能,这些业务操作,实际上也就点一下就可以的;并且现在手机的语音机器人还不能跟app的语音穿透,我还是得打开app才能用语音,不是很方便,对于一个业务系统而已,没啥用处,不过倒是对于一些智能家居,家电倒是用处还挺大的

      我就想业务系统的中的业务办理,是否也能够用上语音呢?就跟科幻大片里面的一样,说某个功能,机器人就会打开,然后会主动问你业务相关的一些东西,我只要回答内容就可以了,比如一个业务,有四个步骤,人工操作的话,要一步一步来填一些东西,选择一些内容,用语音的话,问题的关键就在于现在的语音都只是 一问一答的模式,机器人无法把你的前一句话跟后一句话关联起来,也就是没有 过程式的语音交互,

      在网上有听说,老外弄出了一些智能机器人,最近有个国家的还把机器人称为合法公民了,不知道这个机器人有没有 实现这个过程式的语音交互额? 本人对这块现在还只是了解一点点,不知道有没有大神了解这块的,希望帮忙解惑一下?谢谢了

      我自己做了一个简单的设想,要实现这个过程式的语音交互,那就得把现在语音控制扩展一下,

  1、现在的语音可以看成是只有一个主线程的,要实现过程式的那就得弄一个主线程+多个子线程的模式,每个业务都创建一个子线程,来管理这个语音对话的过程,语音控制应该更加的智能,可以加上用户使用习惯进去,比如现在的语音识别就是通过数据库中的关键字来匹配的,系统最初设定的时候肯定只有有限的几个关键字的,不同的用户有自己的习惯,那么当识别不了用户的话时,可以根据已匹配的几个关键字来询问用户说的话是什么意思(跟设定好的关键字来匹配),然后把用户说的话的关键字保存到匹配库里面,那么下次就可以识别用户说的是什么意思了(这个是现在所有的语音识别的里面都应该做到的,因为现在的语音识别太不好用了,就是识别率太低),另一个方面还需要利用大数据,把每个用户的习惯都保存到大数据库,这样来改进自己的产品,也可以让用户直接到大数据库匹配,如果本地匹配不到的话

  2、要想再业务系统中用来语音控制那就得设定好业务模板,让机器人能够知道这个业务是干啥的,业务的步骤,每个步骤要干什么等等,同时模板要加上现在的人工智能系统、大数据系统,可以自主学习,这个自主学习,可以简单一点,比如业务系统初始的一个标准的业务模板,用户可以有自己的使用习惯,人工智能系统就是把用户的习惯保存到业务模板中,这样让模板更契合用户的使用,同时利用大数据,可以把别的用户的好习惯,或者说模板的不足之处进行改进

   3、前面两个都是单独的模板,那么还需要一个统一的控制器来统一管理,当用户通过语音发起一个业务(这个业务可以根据情况来配置,太复杂了,还是不要配置了,说太多的话也挺傻逼的),首先通过语音识别匹配是什么意思,如果是一般对话,就没必要进行这个控制器,如果是业务的话,就进行控制器,控制器创建单独的语音线程来管理整个语音对话过程,同时读取对应的业务模板,根据业务模板的业务内容来进行交互式的问答,设置的好可以保证上下对话的关联性,从而实现整个业务过程(业务需要配置的东西会非常多,但觉得至少是一种非常好的,业务交互的改进的方式)

以上是我的一些猜想,感觉挺幼稚的,在各位大家面前不值一提,里面的缺点会有很多,问题有很多,需要解决的技术点也很多,还请大神赐教了!

<无标签>
举报
786789256
发帖于2周前 2回/35阅
共有2个答案 最后回答: 1周前

哈,来捧个场。

之前也用过百度的语音,包括语音唤醒和单一业务控制等,确实如你所说,并不能实现过程对话。

我觉得IFTTT是可以用来借鉴的一个做法,将各个操作切割成最小元素,并用相应的语音关键字/词关联。

--- 共有 2 条评论 ---
bbdlg 回复 @786789256 : 前景是有的,不过也是蛮累的,一个人单打独斗可能并不能坚持下去,不妨试试开源,也许某天能发扬光大的 1周前 回复
786789256多谢捧场,单纯的IFTTT也只能实现一些简单的场景,我设想的业务模型就是用到这点,将业务进行细分化,感觉还是挺有前景的, 1周前 回复
顶部