专利内容由知识产权出版社提供
专利名称:一种基于马尔科夫决策过程模型的会话搜索方法专利类型:发明专利
发明人:刘峰,朱荣鑫,唐丹丹,张苏可,丁霄汉申请号:CN201610237174.9申请日:20160415公开号:CN105930400A公开日:20160907
摘要:一种基于马尔科夫决策过程模型的会话搜索方法,包括如下步骤:1)准备阶段,爬取足够多的网页,获取语料库全集C;C为爬取的网页集合经过筛选后的结果;每个网页内对应有文档d;训练人员进行自发的会话搜索并记录其过程以获取训练数据,生成训练文档;2)训练阶段,数据预处理,统计检索阶段中需要使用的词语t与文档d之间的关联度,包括使用狄利克雷平滑P(t|d)和不使用狄利克雷平滑的P(t|d);3)检索阶段,接收用户当前输入的查询语句q;通过公式计算语料库全集C中每个文档d与当前查询q的关联度;计算每个文档d与整个会话搜索的关联度;返回关联度高的前N篇文档。
申请人:南京大学
地址:210093 江苏省南京市鼓楼区汉口路22号
国籍:CN
代理机构:南京瑞弘专利商标事务所(普通合伙)
代理人:陈建和
更多信息请下载全文后查看