专利内容由知识产权出版社提供
专利名称:一种基于随机映射直方图模型的文本无关说话人鉴
别装置
专利类型:发明专利发明人:于泓,马占宇,郭军申请号:CN201410232526.2申请日:20140528公开号:CN103985384A公开日:20140813
摘要:本发明实施例公开了一种基于随机映射直方图模型的文本无关说话人鉴别方法。该方法包括如下步骤:特征提取步骤:将非归一化递增的线谱频率特征变换归一化的差分线谱频率特征并将相邻帧的差分线谱频率特征进行组合生成复合差分线谱频率特征以表达信号的动态特性。模型训练步骤:根据复合差分线谱频率特征的分布特点设计随机映射参数,对训练数据集进行随机映射并通过计算平均直方图来构建概率模型。鉴别步骤:对待鉴别人的语音信号按照步骤一提取特征后输入到步骤二训练得到的模型中,计算针对每个概率模型的似然值,获取最大似然值,确认说话人编号。利用本发明实施例,能够提高文本无关的说话人鉴别率,具有很大的实用价值。
申请人:北京邮电大学
地址:100876 北京市海淀区西土城路10号
国籍:CN
更多信息请下载全文后查看