专利名称:一种文本分类方法、装置及计算机可读存储介质专利类型:发明专利发明人:崔燕红
申请号:CN201910250309.9申请日:20190329公开号:CN109947947A公开日:20190628
摘要:本发明公开了一种文本分类方法、装置及计算机可读存储介质,首先获取测试文本;之后提取所述测试文本中的关键词;再通过语义配对算法根据所提取的关键词进行配对特征提取,得到所述测试文本的语义配对特征;最后根据所述测试文本的语义配对特征确定所述测试文本的文本类别。如此,本发明通过提取出具有skip‑gram特性的带有语义特征的搭配,可以更好的支持文本分类,从而大大提高文本分类的可靠性。而且,由于Skip‑gram算法是有语义的,故通过对不同分类的支持程度,可以转化成文本模型,这将在基于语义的推荐模型上起到很大的作用。
申请人:北京泰迪熊移动科技有限公司
地址:100085 北京市海淀区信息路甲28号7层D座07A36
国籍:CN
代理机构:北京乐知新创知识产权代理事务所(普通合伙)
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容