您好,欢迎来到九壹网。
搜索
您的当前位置:首页wav文件格式

wav文件格式

来源:九壹网
-EE-}  E运用多媒体WAV文件格式二三例中国人民电子工程学院(合肥230037)徐济仁王昌宝陈家松    摘要Windows的WAV文件提供的语音信息包括大量的信息,可用于波形显示、频谱处理,还可以满足语音特征识别的要求。通过此方法提供的语音信号采样数据,方法简单,应用广泛。关键词    WAV文件波形显示讲话者识别    多媒体技术近年来发展很快,较好品质的声卡硬盘的逻辑代码(C:或D:),而“LIST" chunk即为可以提供16bit的立体声及44kHz的播放录制能其下的子目录,其他的chunk则为一般的文件。至力,它不仅可以提供原音逼真的取样,合成的音质也于在RIFF文件的处理方面,微软提供了相关的函十分理想,有的声卡还加人了数字信号处理器,可编数。视窗下的各种多媒体文件格式就如同在磁盘机程控制的DSP具有强大的运算能力,它可以用来作下规定仅能放怎样的目录,而在该目录下仅能放何声音信息的压缩和一些特殊效果的处理。具有此功种数据。能的声卡提供的WAV文件提供的语音信息可以满    WAV为waveform(波形)的缩写。声音文件的足语音特征识别的要求。结构如图1所示," RIFF”的格式辨别码为1  RIFF文件和WAV文件格式"WAVE"。整个文件由两个。hunk所组成:辨别码"fmt"(注意,最后一个是空白字符!)及“data".    在Windwos环境下,大部分的多媒体文件都依"RIFF"循着一种结构来存放信息,这种结构称为“资源互换x x x x文件格式”( resources interchange file format,简称"WAVE,RIFF)。例如声音的WAV文件、视频的AV I文件等等均是由此结构衍生出来的。RIFF可以看作是"fmt"一种树状结构,其基本构成单位为。hunk,犹如树状sizeof (PCMWAVEFORMAT)结构中的节点,每个chunk由“辨别码”、“数据大小”sturct of PCMWAVEFORMAT及“数据”所组成。data辨别码由4个ASCI    I码所构成,数据大小则标xXxX示出紧跟其后数据的长度(单位为Byte),而数据大wave form data小本身也用掉4个Byte,所以事实上一个chunk的图1                  WAV文件结构长度为数据大小加8。一般而言,chunk本身并不允在“f    mt”的chunk下包含了一个PCMWAVE-许内部再包含chunk,但有两种例外,分别为以FORMAT数据结构,其定义如下:"RIFF',及“LIST”为辨别码的chunk。而针对这两t    ypedef sturct pcmwaveformat-tag {种chunk, RIFF又从原先的“数据”中切出4个WAVEFORMAT     wf ;Byte。这4个Byte称为“格式辨别码”,然而RIFFWORD     wBitsPerSample;又规定文件中仅能有一个以“RIFF”为辨别码的}PCMWAVEFORMAT;    chunk.t    ypedef sturct waveformat-tag {只要是依循这一结构的文件,我们均称之为    WORD     wFormatTag;WORD     nChannels;RIFF文档。这种结构提供了一种系统化的分类。DWORD     nSamplesPerSec;如果和MS - DOS文件系统作比较,"RIFF" chunkDWORD     nAvgBytesperSec;就好比是一台硬盘的根目录,其格式辨别码便是此WORD     nBlockAlign;《电子技术》2001年第1期上海华为信息技术有限公司021一5385 2300   -61-万方数据万方数据}WAVEFORMAT;      65536,不过Windows却定16位元其值的范围为一其意义分别为:    32168-- 32167。此外尚有一点要注意的是,0并不wFor    matTag:记录着此声音的格式代号,例如一定代表无声,而是由中间的数值来决定,也就是在WAVE _ FORMAT一PCM, WAVE_ FORAM_ AD-8位元时为128,16位元时为0才是无声。所以,若PCM等等。程序设计时需放人无声的数据,需特别注意声音格nChannel    s:记录声音的频道数。式是16或是8位元,以放人适当的值。n    SamplesPerSec:记录每秒取样数。nAvgByt    esPerSec:记录每秒的数据量。2  WAV文件信息的具体应用nBl    ockAlign:记录区块的对齐单位。    WAV文件中包括了对原始声音的高速率采wBi    tsPerSample记录每个取样所需的位元数。样,并且以WAVE _ PCM _FORMAT脉冲编码调制 "dat    a" Chunk包含着真正的声音数据。Win-格式,我们可以在VISUAL C十十程序中实现,在读dows目前仅提供WAVE- FORMAT- PCM一种数出WAVEHDR文件头之后,下面就是原始声音的据格式,所代表的意义是脉冲编码调制(pulse code高速率采样信息,我们可以对它作多方面的信息处modulation)。针对这种格式,Windows定义了在理。"data"的chunk中数据的存放情形,图2中列出了2.1波形显示四种不同频道数及取样所需的位元数以及位元位置我们可以以时域一幅度的方式显示出原始声音    的安排。的波形,这是最简单同时也是最直接的信息处理方式。在时域范围内,我们可以观察该信号波形是否nChannels = 1,wBitsPerSample = 8连续,中间是否有跳变等。2.2频谱显示我们可以以频域一幅度的方式显示出原始声音    nChannels= 2, wBitsPerSample = 8的频谱,在对原始信号经过快速傅立叶变换(FFT)之后,可以得到该信号的频谱,进而得到该信号的能nChannel          s=1,wBitsPerSample= 16量集中带、分布特征、谱对称系数等等。频道。(低位))I频道。(高位))I频道1(低位))I频道1(高位)2.3用于语言信号识别}(低位){(高位)}(低位)}(高位)}讲话者的个体识别是语音信号处理的一个重要                nChannels = 2,wBitsPerSample= 16内容,但它的一个前提条件是必须提供语音信号的图2              PCM文件中位元安排方式数字波形,通常的方法是将原始的语音信号进人放    第一排表示单声道8位元,第二排表示双声道大、抗混叠滤波、A/D采样、数值编码,最终得到语8位元,第三排表示单声道16位元,第四排表示双音信号的数字波形,通常多采用硬件处理,费时费声道16位元。8位元代表音量大小由8个位元所力,如果我们借助非常成熟的声卡技术,将WAV文表示,16位元则代表音量大小由16个位元所表示。件打开,就非常方便地得到语音信号的数字波形,为理论上8位元可以表示0--255,16位元可表示0-下一步进行语音信号识别提供良好的前端预处理。领域强化直流,直流应用系统性能:性能卓越效率一流I  R功率半导体首先,同步整流集成电路I    R1176,配合新可简化宽频网的低压、大电流输出直流一直流转    国际整流器公司(International Rectiifer,简换器设计,.实现更高的效率和更佳的成本效益。称IR)宣布新一阶段直流直流转换技术开发计其次,用于隔离及非隔离(降压)同步直流    划,推出全新同步整流集成电路IR1176,以及.直流变换器的30V HEXFET MOSFET可降低器新型IRF7822 HEXFET功率MOSFET系列,可件得导通电组和栅电荷。显著提高直流一直流功率系统的运作效率。这些此外,I    R新增加的专用高效直流一直流专用高效器件,为因特网服务器和笔记本电脑的HEXFET功率MOSFET,扩大了电压范围、性新型GHz级处理器,以及宽频网络设备的能水平,还提供了新的封装设计,大大改善了常处理器和定制集成电路,确立了全新性能标准。用功率转换结构的工作效率。I    R最新推出的功率半导体,可在三个主要      (张薇)-62一北电网络(中国)有限公司010 - 6523 7788《电子技术》2001年第1期

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 91gzw.com 版权所有 湘ICP备2023023988号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务