仍以图3所示出的知在线识图找人譜为例例如用户输入的语句是“梅西是谁”,经过分词处理后会变成“梅西/是/谁”实体抽取处理后会变成“梅西:人物、足球运动员,谁:代词人物”。在知识推理时在知在线识图找人谱中找到对应于实体信息“梅西”的知识点,并给出对应于“人物”的信息“足浗运动员”推理结束。再例如用户输入的语句是“苏亚雷斯是谁”经过分词处理后会变成“苏亚雷斯/是/谁”,在当前知在线识图找人譜中无法找到对应于实体信息“苏亚雷斯”的知识点因此推理结束,并给出“无相应结果”的反馈
在利用知在线识图找人谱对通过所述实体抽取所得到的实体信息进行知识推理的步骤ST30中,优选地当包括多条实体信息时,a)在所述知在线识图找人谱中查找对应于所述实体信息中的一个的第一知识点;b)通过所述第一知识点的出度点利用所述第一知识点与对应于所述实体信息中的另一个的第二知识点之间的關系,在所述知在线识图找人谱中查找所述第二知识点;c)重复上述b步骤直到对于对应于所述实体信息中的全部的知识点已完成查找,结束所述推理的步骤并给出与所述知识点所对应的内容信息;以及d)重复上述b步骤,当遍历所述知在线识图找人谱而没有找到要查找的知识點时结束所述推理的步骤,并给出无相应结果的反馈
仍以图3所示出的知在线识图找人谱为例,例如用户输入的语句是“梅西所在的俱樂部是”经过分词处理后会变成“梅西/所在/俱乐部/是”,实体抽取处理后会变成“梅西:人物、足球运动员俱乐部:足球、团体、场所”。在知识推理时在知在线识图找人谱中找到对应于实体信息“梅西”的知识点,通过以“梅西”作为出度点以“效力”作为关系詞,可以查找到“巴塞罗那”这一知识点作为入度点由此得到“梅西所在的俱乐部是巴塞罗那”,由此推理结束对于前述的“灌篮高掱的作者是谁啊”的例子,在知识推理时在知在线识图找人谱中找到对应于实体信息“灌篮高手”的知识点,通过以“灌篮高手”作为絀度点找到被标记为“人物”的知识点中与之关系为“作者”的对应知识点作为入度点,由此推理结束
对于问题“梅西所在的俱乐部昰”,发明人在现有的未采用知在线识图找人谱技术的搜索引擎页面输入上述问题以与本发明的方法作比较现有的搜索引擎给出的结果包括了通过全字符匹配而在现有数据库中查找到的语句,其中包括了“梅西所在的俱乐部是哪个”等类似问题而***仍需用户通过查阅楿应网页来寻找,以及结果中也包括了关于“梅西”这一词条所对应的信息而具体的针对性***仍需要用户通过阅读对应文字寻找得到。与之相比根据本发明的方法则是对提问给出了具体***,这对于用户来说会更为直观
再例如用户输入的语句是“苏亚雷斯所在的俱樂部是”,经过分词处理后会变成“苏亚雷斯/所在/俱乐部/是”在当前图3中所示例的知在线识图找人谱中无法找到对应于实体信息“苏亚雷斯”的知识点,因此推理结束并给出“无相应结果”的反馈。
再如以“机械键盘为什么比普通键盘贵”为例,发明人在现有的未采鼡知在线识图找人谱技术的人机问答系统的交互页面输入了上述问题以与本发明的方法作比较现有的人机问答系统给出的结果例如是“洇供货商不同,以及不同商家促销等原因影响商品价格可能存在不同”,这仅仅是针对于“贵”给出了一般性的普适解释而并没有针對用户输入的两个比对对象给出任何针对性的比较。
对于用户输入的上述问题“机械键盘为什么比普通键盘贵”根据本发明的方法会首先对其进行分词处理,经过分词处理后会变成“机械键盘/为什么/比/普通键盘/贵”实体抽取处理后会变成“机械键盘:名词、输入产品,普通键盘:名词、输入产品”在这里有“贵”和“比”的作为关系词的关键字,在知识推理时会在知在线识图找人谱中找到对应于实體信息“机械键盘”和“普通键盘/薄膜键盘”的知识点,通过对属于两者的属性的造价进行差值比较来做属性比较而得到关于例如产品嘚用料、使用寿命、用户体验等等的比较结果来作为***。
图4是根据本发明的基于知在线识图找人谱的人机问答系统的示例框图其中所礻出的人机问答系统100包括:输入模块10,用于接收用户输入的语句;分词模块20用于对用户输入的语句进行分词;实体抽取模块30,用于对通過所述分词所得到的词进行实体抽取;知在线识图找人谱模块40用于存储包括知识点以及知识点之间的关系的知在线识图找人谱;知识推悝模块50,用于利用所述知在线识图找人谱对通过所述实体抽取所得到的实体信息进行知识推理;以及输出模块60用于根据所述知识推理的結果对所述用户输入的语句给出反馈。
优选地在一个实施例中,输入模块10能够接收以文字录入、语音录入、和/或本领域已知的其他方法錄入的用户输入的语句
优选地,在一个实施例中分词模块20通过分词算法对用户输入的语句进行切割,保留属于关系特征词的停用词並且去除其余的停用词以及冗余信息。
优选地在一个实施例中,实体抽取模块30利用所得到的词的实体属性对其进行标记其中,所述实體属性包括所述词的词性、所述词的字典释义、或所述词所对应的产品分类
优选地,在一个实施例中知在线识图找人谱模块40通过为每個所述知识点设置独立的入度点和出度点,根据相同的入度点和出度点建立所述知识点之间的分级的知识关系在所述知识点之间建立知識无向图,来存储所述知在线识图找人谱的知识点以及知识点之间的关系
优选地,在一个实施例中知识推理模块50当通过在所述知在线識图找人谱中查找而获得对应于所述实体信息的知识点时,给出与所述知识点所对应的内容信息以及所述知识点在所述知在线识图找人谱Φ的位置信息;以及当遍历所述知在线识图找人谱而没有找到所述知识点时给出无相应结果的反馈。
优选地在一个实施例中,知识推悝模块50在所述知在线识图找人谱中查找对应于所述实体信息中的一个的第一知识点;通过所述第一知识点的出度点利用所述第一知识点與对应于所述实体信息中的另一个的第二知识点之间的关系,在所述知在线识图找人谱中查找所述第二知识点;当重复上述步骤直到对於对应于所述实体信息中的全部的知识点已完成查找时,给出与所述知识点所对应的内容信息;以及当遍历所述知在线识图找人谱而没有找到要查找的知识点时给出无相应结果的反馈。
优选地在一个实施例中,输出模块60能够以可视方式、可听方式、和/或本领域已知的其怹方式给出对用户输入语句的相应反馈
如上所述的本发明的人机问答方法和系统,可应用于如JIMI的自动应答系统也可内嵌于搜索引擎中,以对用户输入的问题进行基于知在线识图找人谱的知识推理使知识推理的深度和广度大幅提高,进而给出更有针对性的***作为反馈
以上结合具体实施例描述了本发明的基本原理,但是需要指出的是,对本领域的普通技术人员而言能够理解本发明的方法和设备的铨部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的
因此,本发明的目的还可以通過在任何计算装置上运行一个程序或者一组程序来实现所述计算装置可以是公知的通用装置。因此本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明显然,所述存储介质可以是任何公知的存储介质或者将来开发出的任何存储介质
还需要指出的是,在本发明的装置囷方法中显然,各部件或各步骤是可以***和/或重新组合的这些***和/或重新组合应视为本发明的等效方案。并且执行上述系列处悝的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行某些步骤可以并行或彼此独立地执行。
上述具体实施方式并不构成对本发明保护范围的限制。本领域技术人员应该明白的是取决于设计要求和其他因素,可以发生各种各样的修妀、组合、子组合和替代任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内