维普资讯 http://www.cqvip.com I『}冀.- ^ 一、概述 语音门户(Voice Porta1)是固定电 话语音网、移动电话语音网与Internet数 据网相结合的语音业务服务系统,它为 电话用户、计算机用户提供了基于交互 式语音获取资讯的信 皂,服务方式。通过 语音门户,移动电话用户、固定电话用 户、Internet用户等,都可以随时通过拨 打语音门户系统的服务接入号,接入语 音门户,以交互的语音方式获得Internet 信息、SP的专业数据等的信息服务。 语音门户技术在近几年内得到全世 界信息服务提供者,尤其是电信运营商 的极大关注,而语音门户能够实现大规 模应用的重要标志之一,就是电信级语 音门户系统的成功构建。面 多年以来,新太科技在电信级语音 门户的技术研发和标准化方面投入了大 量的研发力量,在电信级语音门户的构 建方面积累了大量的科研成果与工程经 验。本文将从语音门户的服务架构、技术 要求、技术体系、业务模式几个方面描述 新太科技对于电信级语音门户的构建策 略与经验。 二、语音门户的服务架构 语音门户的服务架构与Internet的 服务架构相类似,如图1所示: 其总体结构按服务功能的层级共分 五层,每层均是为其上一功能层提供服务 的基础.它们分别是: f)VJ囤络设备供应尚层 2)VJ囤络搓入提r旦高层(v-Jse), 3)VJ座用服务提供高平台层(V—ASP), 4)VJ内窖服务提供高层(v- ̄cP), 5)最终用户层。 1、设备提供商 任何一种业务的开展都离不开由系 统软、硬件组成的系统平台的支撑。它提 供了由物理设备建立起来的连接用户与 专题热点 新太科技 郑炜 一簪I南电话用广h…r・用广 和使用习惯等诸多因素会在很大程度上 b 一_嗣蛔.軎^焦件. 钎 机柚.盘易所 影响语音门户的效益,所以,语音门户 中■IE信,帽S ̄ilo萁 的构建应该以用户的需求作为标准之 雌稍■雌●■ 一巾■IE信,中叠善 . 。 萁 运曹■ 一 三、建设语音r 平台的基本要求 图1 1、基本的莰术翼术 按照语音门户的服务分层结构,建 设语音门户应该满足以下的基本条件: 移动互联网服务的连接通道,如网络设 f)、语音 户作为一个新型的基于语 备路由器、交换机、计费结点等,使语音 音服务的平台.应当色畲0前已{}i的声 门户的正常运行和客户获得快捷的服务 讯平台的全部劝能或同现奇的声讯平台 成为可能。语音门户的构建设备大多数 卖现互联互通。对于0前的址务开最镬 都由网络或系统集成商提供,设备提供 式,如愿奇址务的匐定义,计谚方式,服 商提供的软、硬件是否成熟、可靠直接关 务方式(人工/匐动)芳应该继瑾遁鲼, 系到语音门户能否高效、可靠的运行。 在此基础』:扩展对话音址务的控制和服 2、V—JSP网络接入理罄商 务。 V—ISP可以是中国电信、中国移动, 2),孽皖应霹奇丧妤的扩展住.可 也可以是其他的专业网络服务运营商。 与 同的内客提供高违摇.在通讯协议 主要是为用户和服务商之间提供语音门 上虚皖一使用TCP/JP协议再{}i括瞧的摇 户的网络访问路由通道。如提供接入链 口规范。只霎内客猩供高辖照括:僵的摇 路带宽、主机管理、网络设备的管理维 口规范编写搓口代码,就可 参现同话 护、路由策略的选择等。 音门户反层平台的违摇。 3、V—ASP应用服务提供商 3),技术满足VSP厦V- ̄CP的列 V—ASP应用服务提供商可以是网 分。VsP主要的功能是褪r旦磋入、认证和 络运营商、但目前的趋势是更多表现为 计赞等功能,V-JCP提供内孪服务,对于 一些专业的、虚拟的网络服务提供商。其 内客的 方式必须括瞻化.语音 户 主要任务是为语音门户业务的实现开发 申应该霹奇对于车富多彩的固特囤的JCP 和提供适合用户使用的应用服务功能的 的内窖的主耪的方洁。 实现。 4),音门户的服务提供者陲了提供.;:; 4、V-lOP内容服务提供商 舍语言扩展括记语言(Voice x^^L)格式或 V—ICP是整个语音门户的服务内容 者#他新的括瞧(如语音座用程序语言 提供商。其负责根据用户要求和选择提 l于 (sAL丁)等)的内客 外.在整个囤 供各种各样的服务内容,它是应用服务 络中.c互庄色含必要的智能人互服务和 的直接提供者,是语音门户的中的重要 智锯匐劝孽皖(如匐然语言智能虚爸辱 市场主体。其提供的服务内容对用户满 统)。 度有较大的影响。 2、莰术连型的重要噬 5、最终用户 在整个语音门户的系统中,存在两 最终用户就是语音门户服务面向的 个关键的语音技术:ASR(语音识别)技 对象,其对各种干语音业务的使用偏好 术和TTS(文本转语音)技术。目前涉 维普资讯 http://www.cqvip.com 专题热点 及这两种关键技术的功能已经被各家语 音技术的提供商开发为的ASR引擎 和TTS引擎,只需要在语音门户的构建 过程中将其集成到相应的系统来即可, 这种透明的集成方式需要有可靠的技术 … 囊}誊 处理芯片,并配合两种不同的总线:交换 总线可{守制处理中心的结合,提供交换 和语音一体化处理服务器,该服务器具 备电信要求的CPCI的总线,CPCI总线 能够具备如下的基本电器特性: ●具备双CPU卡的冗余处理机制, 能够完成CPU在线切换和分布式处理。 ●能够完成电路交换和把语音按照 群分、哆出回复,哼叫转移、呼叫等待, 固的提供CSTA摇口)、露寄ACO(Automatic cart D m 6“t 0 /匐动哼叫分配嚣)功能。 3)、铭够完威话路的建立、援号、话 路控制、转移、会议每以厦回络摇入等方 面夏聋的转籀,可 主持灵活多样的综 合排队策略 厦智钨路由功锯可以主持 用户 电话、传直、计算机、电话会议、 .指标和评测作为保障,可以根据具体的 需求制定标准后,再根据标准来选用不 同类型的ASR; ̄I1TTS引擎模块,降低由 于某些不成熟的技术细节造成的风险。 一 ̄nteTnet Phone等方式摇入到孽统申来。 G723、G7ll等格式进行IP编码和解码 处理。 般说来,由于TTs的技术相对成熟,所 以对于ASR引擎的关注成为整个语音门 户技术选型的重点。 f)、TTS引擎适型的括缝包籀 ●朗读的自然性 ●对于多音多义字的处理 ●对于特殊字符的处理 z).ASK引擎递型的熏点包籀: ●已支持的语言 ・非标准中文的识别效果 ●多语识别的能力 ●是否支持复杂句子识别 ●是否支持大词汇量的中文词表 ●是否支持动态语法 ●是否支持Barge~IN(语音打断) 功能 ●是否具有回声消除功能 ・是否支持通用的技术标准,如 VoiceXML,或者SALT等 四、语音门户的技术体系 语音门户的平台技术体系如图2所 示的语音接入服务器中封装了基于 VoiceXML的解释器,其也可以封装其 他标准的解释环境和组件。由于 VoiceXML标准成型时间较长,这里以 其为例,基于SALT标准的技术体系与 之类同。 1、语音接入服务器 语音接入服务器主要负责功能包 括: f),县寄完蔷的局问皇上理信舍,包籀 由嵌中国一号信舍、OSSf、由嵌H 323哼 叫协议拔、主持中国七号信舍。 z),霹备寄座席端口、网络端口、H 323 端口、语音/传直资源互上理肇元、 电路交籀和包支籀哼叫管理功锯(用户 母叫皇上理、入出辨队、路由控和j、申鲢合 ●具备最小4个El的接入到在一个 单模块机框内部达到32个El的接入。 ●内嵌有中国一号信令; ̄IIISDN PRI DSSl信令 ●在增加了SS7模块后,能够支持 SS7。SS7能够做到冗余处理。 图2 ●能够做到在超过一个模块的时候, 可以通过光纤模块进行级联。 4)、主持R.AD. ̄US协议,可 向EAD ̄US ●语音媒体和传真媒体都嵌入在每 认证服务器发出认证请求信息,完威话 一个单模块的机框内部。 苹实日寸蠡上理功能。 z)、分布式交籀皇上理的解决方案 5).主持对VolceXML信息皇上理服务器 交换处理模块和媒体处理模块分布 的请求 厦皇上理,包括哼入请求,摇收 式处理。使用可编程前置交换机,其开 Voice xML信息盘上理服务器的唠叫皇上理请 放式可编程交换平台的容量 求再作出相应。通迫主语转籀(TTS)和 从60到30000端口,融合语音和 语音 副(A9R)功能,完威与VoiceNtV ̄L信 数据网络,支持多种互联协议 皂皇上理服务器之问的交互,包括能够把 (七号信令TUP/ISUP/SC CP/ 经辽VoiceNML信息盘上理服务器量上理的支 TCAP、ISDN、中国一号信令、H. 本转籀威舍威的语音播报给用户,也能 323、TCP/IP、MGCP、SIP),提供电 够把用户的语音违择转籀威主事交给 信级的可靠性、完全的冗余备 VoiceNtV ̄L皇上理服务器鳊程UKL提交适端 份和强大的开发能力。在在处理 的JCP。 上可以有多个交换处理模块叠加处理, 语音接入服务器是接入平台的核心 使用冗余的光纤环路不断进行模块的叠 部分,它由六部分组成接入交换处理模 加,单模块可以做到64个El(2048个话 块、VoiceXML解释器、媒体引擎、TTS 路)的交换处理,多模块的叠加处理可以 引擎、ASR引擎。以上各个部分相互配 达到1024个El(32K)的交换处理。 合,协同处理,共同完成语音处理功能, 媒体处理模块是由单独的语音处理 提供标准的协议处理接口,完成到接入 机组成,每个语音处理机使用高性能 和语音处理的功能。语音接入服务器一 DSP处理芯片进行语音/传真等媒体处 般具有有两种不同的解决方案,能够针 理。媒体处理模块与交换处理模块之间 对不同的需要提供不同的解决方案。 的连接使用数字中继进行继续,中间的 接入交换参E理和堞降处理模块 处理信令采用无信令,加速了交换处理 接入交换处理模块,具有完整的时 模块和媒体处理模块之间的信息交换和 分交换的所有特性,在接入能力上,有两 处理速度。 种不同的解决方案: 3、Volc ̄>OVlL解释器 f)、一体亿壹上理嚣的解决方案 作为互联网语音化的核心技术, 使用目前国际上流行的语音和接入 VXML技术可以实现对文字内容的语音 维普资讯 http://www.cqvip.com ~~…一一一 .——~ ~一…一 一 …! ~一 ÷ _ 一一女 ~■~ … ……一~~一一~一 一 ■凸罐氅‘ == —————————————————————一.:. 控制。VoiceXML是一个由AT&T, IBM,Lucent and Motorola率先领导 ASR服务器完成用户语音的识别, 监控/维护/配置接口层实现与系 统的监控/维护/配置模块的接口。 7、AAA服务器 这是语音门户的关键环节。ASR引擎可 以按照定制的关键词,识别用户的服务 及发起的语音标记语言规格.这些CTI 的大厂将原本各自发展的Telephony Markup Language(IBM的speechML, Motorolla的voxML, AT&T的 要求,并同媒体处理模块一起完成对用 户的服务。 AAA服务器可以提供基于内容的计 费和认证信息。包括: f),密现基于丙客的用户身份的认 证。 ・实现语音识别系统提供的断句处 理功能、Barge-In功能和动态语法功能 TelePorta1)协调整理之后送给World Wide web Consortium(W3C)审查,2000 年5月13日W3C接受了voice exten- sible markup language 1.0规格 ●集成语音识别系统之后的平台同 时支持语音和按键两种用户交互方式; ●提供日志记录功能; z)、根据用户访固的内容住届的 同 密现 同的贾车设置,再能正确生破话 苹。 (VoiceXML).。通过VXML就可以实现 网页HTML内容和电话语音的交互。我 们在媒体处理模块中内嵌了一个VXML 解释器,可以对符合该规范的网页内容 按客户的需求进行解释,实现交互服务。 ●接收呼叫分配,获取基于Voice XML 2,01g,准的业务流程文件,进行解 释和执行; ●具备日志、流程跟踪和告警功能: 对系统的运行有详细的日志记录,并且 提供监视终端,能实时监控系统的运行 情况,对服务器的运行异常进行告警; ●具备业务配置、管理功能; ●扩充与DBA Server的接El,通 过接El实现对数据库的操作; ●扩充与AAA的接El,通过接El 实现计费、授权.认证功能; ・扩充与第三方网关的接El,通过 接El实现与第三方网关的通信; ●实现与Media Server的接口,通 过接口实现媒体服务功能,包括ASR、 TTS等功能; ●Voice XML脚本开发包,给用户提 供业务流程开发工具,具有调试、跟踪功 能。 4、T下s I I TTS服务器完成文本向语音的转换 过程。它分成文本分析、韵律生成、语音 合成三部分。文本分析模块实现文字的 拼写检查、断句识别和标点停顿识别。韵 律生成模块是根据文本分析模块的结果, 对韵律,说话的语气进行识别标识。语音 合成模块是根据语音库和上面两个模块 的分析结果并结合具体的计算机设备合 成可以播放的语音文件,并结合IVR实 现语音播放。 5、AsR I擎 ●具备维护管理功能,包括配置、跟 踪和告警,要求在整个平台维护终端实 现 6、媒俸 l擎 媒体引擎主要负责完成业务流程登 记、管理、业务呼叫的处理,提供语音播 放,DTMF的接收和发送,传真的接收 和发送,业务数据的访问和业务话单的 产生等,同时通过接入处理模块实现用 户呼叫处理、入出排队、路由控制、中继 合群分群、呼出回复、呼叫转移、呼叫等 待等功能。在一体化解决方案中还可以 提供媒体网关功能模块,负责将语音信 息转换为IP数据包在IP网络上进行传 输。IVR包括以下层。 f),通信主撑层为各个攒谚之【司和各 个Z作站之同提供通信机和J。 z)、硬件资源层是由各种资源纽威: 座席资源,回络资溽,jP电话资源,语 音/传壹资溽、吏籀控苇IJ资源等。各种资 源握垂址务流程控静J层资源控和J命令执 行相应的动作,然后返回执行结粟和事 件。 3),Call CD^ttDc M4^4je2 Call Control Manager主要对各种 呼叫进行管理,完成用户呼叫处理、入出 排队、路由控制、中继合群分群、呼出回 复、呼叫转移、呼叫等待等功能。 4)、业务流程控和J层耐业务滴程编 译生威的申同代码‘璺行解释.执行。 5)、业务流程就是业务流程溽主件 缟诤生威的申问代码.是 扶吝机形式 描(圭的业务流程。系统采用GSTA呼叫皇上 理攒型,枵每一个呼叫都从羁体硬件中 出来.从币可 方便斩业务的叠加, 尊中呼叫都分是由cn“Mnnnjet层来完 威.需要的硬件资源由硬件资;乐层完威。 3)、与全回的计赞平台在现教据吏 互。 4)、可 密现平台操作另的认证和杈 限的正确 纠。 5)、主持计赞信息的机密可靠传输。 8、事务处理服务器 事务处理服务器即工作流服务器, 它可以监控并保证用户的服务得到正确 及时的处理。可以给用户汇报服务的进 展状况等。 f)、根提客户端的服务请袭.判嘶对 应的服务项0再启动相应的Z作滴程。 2).跟踮的也屉千蠹.兄。再及口寸调整耐 应的资溽.保证Z作.麓的顾纠进行。 3)、羁有智钨策略管理功能.可 耐 用户的请求在一定的花固由递择最佳的 Z作。iI程。 语音门户中,用户获得信息的主要 手段是语音。除了自动语音服务外,为了 更好的服务用户,我们设立了坐席,可以 帮助用户对于通过自动语音无法实现的 业务转移到坐席,由坐席来完成具体的 服务内容。当用户需要坐席服务时,可以 通过拨打手机上的某个按键或者通过输 入固定的语音如“坐席服务”,由接入服 务器捕获用户的请求,转交给事务处理 服务器处理,由事务处理服务器负责通 知后台的业务应用服务器和坐席机以实 现语音与数据的同步。 f)、事务主上理服务器铅够管理多个客 户端的邑握.并向猩入服务器发签入包; 当客户端与事务让理服务器嘶再违握逐 出服务时.TPS向搓入服务器发签出色。 2)、当呼叫|lj 、释放、应芬芳事件 由握入服务器发 事务盘上理服务器上耐. 由TPS狍这些消息由构件调用搪 客户 端上.由客户端作相应皇上理。 维普资讯 http://www.cqvip.com 3)、事务皇上理服务器霹有雏护箍口. 可 设差启劝服务、乒 服务的功能。 4)、事务皇上理服务器提供参羞乏设置摇 口.雒够完威雒参羞乏设置。 5)、事务皇上理服务器巧 产生话秀勇 上旌、下旌的日考记泵,呼叫皇上理的计赞 记录。 9、scE业务圭茂环境 SCE是整个接入平台的关键部件, 它具有支持用户开发业务的各种工具, 可以快速有效的开发新业务,满足用户 不断变化的需求。SCE提供了一个环境, 在这个环境中,能够用业务构件 (SIB)自由得生成新的事务策略,实现 对于业务事务的定义、开发、仿真、测 试、生成和加载,便于更改。 SCE提供良好的全中文图形编辑界 面,有在线帮助和协助编码的功能。能够 在线加载新业务和对现有业务进行修改 而不影响正在进行的业务。 包括以下内容: f)、事务执行策略。为事务皇上理服务 器卢斤用的控和j让务执行的逻辑策略。 2)、事务管理策略。为事务皇上理服务 器用于业务管理的事务逻辑。 3).事务羞乏据策略。定义事务宣上理服 务器的业务羞乏据和业务用户羞乏提的结构, 以厦和业务管理相关的结构。 4).|事务青舌笈策略。定义趾秀逻辑中 的鲐发信垂。 10、IGP信息网笑 在单点建设的时候需要一个ICP信 息网关,通过该网关为V~ISP*N各个ICP 的数据交换提供一个安全,快捷的信息 通道。对ICP进行登记管理,为每一个 ICP登记和发放一个注册号码,对来自 ICP的未经登记得业务代码进行过滤, 对于没有注册的I CP的访问各位拒绝。 能够提供来自不同信息源的计费信息, 方便与各个不同的ICP信息源的费用结 算。 11、cAU内容审核单元 因为V—ICP提供的内容十分庞大, 质量也参差不齐,按国家法律的规定,有 必要对各V—ICP提供服务的内容进行必 要的审核。内容的审核包括两个部分。一 部分是当V—ICP申请加入语音门户时的 专霹癸书 一一一~一 鼍 孳童 釜墨等 内容审核。另一部分是在正常服务过程 系列的选单和表格。客户说出命令来进 中,对内容的监控审核。内容审核单元可 行选单选择和填写表格。一旦找到所需 以对内容是否允许访问进行控制。当发 的数据库记录,系统会通过播放事先录 现某些ICP提供的内容非法时,可以向 制好的声音文件或通过文字一声音转换 内容管理员发出告警信息,提醒内容管 装置播放数据库中的文字记录来将信息 理员暂停或关闭该V—I CP,也可以对 提供给客户。 ICP提供服务的过程和内容进行记录。 ●交易应用类 交易应用是指客户打电话希望与基 五、与其他平台的互联关系 于网络的后台进行特定的交易。股票买 作为一个开放的平台,语音门户可 卖、安排旅行、员工打卡、预约会见以及 以和多增信息平台实现互联互通。包括 购买东西都是交易应用的例子。在这类 IDC、声讯平台、短信平台、其他增值业 情况下,系统一般会提示用户以某种身 务平台等。语音门户的语音服务,还可以 份或密码进行登录,然后通过对话引导 和其他的增值业务系统共同组成新的增 用户提供交易所需的数据信息(比如,股 值业务服务模式,未来的信息获取渠道 票的名称和股票数量)。系统通过用事先 将会是多元化的,短消息、语音、数据业 录制好的声音文件或文字一声音转换装 务将实现共通,不同的增值业务模式也 置播放说明、提示和选单选择,客户以声 将走向融合,所以语音门户与其他系统 音命令回应。一旦所需的数据都采集完 的连接显得非常重要了。 毕,系统进行交易并通过播放事先录制 好的声音文件或通过文字一声音转换装 六、语音门户的业务模式 置播放数据库中的记录向客户汇报。 语音门户是一个新兴的领域,也是 2.业务建议 一个非常让人看好的领域。但真正要让 对于移动语音互联网上的信息类业 语音上网得到普及和推广,使它成为可 务来说,在开展时应当考虑如下内容,以 以增值的产业,为移动及ICP们带来实 使得语音互联网能够被大众所接受: 实在在的经济效益,还需要有能被大众 ●时效性强 普遍接受的内容和应用,并肯为此付费。 ●实用性强 一下对语音门户的业务模式进行讨论: ●操作简单,没有相当复杂的界面 1.基本业务 操作。 语音门户的基本业务可以分成三大 对于移动语音互联网上的交l蠹类业 类:信息服务类、交易应用类,无论开展 务来说,在开展时应当考虑如下内各 那种业务,要加强与用户的息息相关性, ●安全性强 要强调服务的个性化、多样化,比如定制 ●实用性强 信息和获得信息可以采用多种方式,语 ・操作简单,~没有相当复杂的界面 音定制的内容可以通过语音播放,也可 操作 ~ 以通过短消息下行,选择e--mail下行, 可以任意选择短消息、语音、计算机上网 七、结语 等方式接收定制的信息或服务。 伴随着语音识别;j文本转语音以及整 ・信息服务类 个CTI技术的不囔走向成熟,使得通过语 客户通过信息服务应用来从网络数 音的方式访晦专业的信息源,享受便捷的 据库中调取信息。打电话获得最新的天 信息服务,甚至遨游庞大的互联网络都成 气预报、影讯、股票行情或医疗保健机构 为可能。新太科技将继续关注语音技术和 名单等都是可以实现语音功能的网络信 整个CTI技术的不断发展,充分利用这些 息应用的例子。通过用事先录制好的声 不断涌现的新技术,构建可以为社会服务 音文件或文字一声音转换装置播放说明、 的新的语音应用系统,长期致力于电信级 提示和选择,应用系统引导客户通过一 语音门户的构建,并为之的业务完善和技 术升级做出不懈的努力。 ■