数字信号处理在wav信号分析方面的应用

【摘要】随着信息学科和计算机学科的飞速发展，数字信号处理的重要性日益显著。本文将详细介绍数字信号处理技术在信号分析方面的实际应用，同时文中给出了matlab仿真程序和结果分析，便于读者进一步认识数字信号处理技术的应用。
　　【关键词】数字信号处理；wav信号；傅里叶变换
　　随着信息技术的飞速发展，数字信号处理理论和技术日益成熟，在各个领域都得到了广泛的应用。本文将通过分析计算机中的wav文件来讨论数字信号处理中的信号分析方法。
　　1 wav文件的一次性傅里叶变换
　　我们选择一个wav文件作为分析的对象，先选择一个简单的wav文件。这里选择的是每个windows系统都有的ding.wav，一个比较单纯的声音“叮……”。
　　1.1 声波主要频率的分析
　　首先执行下面的语句：
　　[w，fs，bits]=wavread（'c：＼windows＼media＼ding.wav'）；
　　sound（w，fs，bits）；
　　y=w（：，1）；size（y）；
　　plot（w（：，1））；
　　figure；
　　y=fft（y，32768）；
　　plot（abs（y））；grid；
　　[m.k]=max（abs（y））
　　该信号的时域波形如图1所示，有size（y）语句可以得到结果为20191，即需要处理的数据量很大，所以对其进行fft分析所需要的点数为32768。求出频谱最大值及其对应的位置为m=490.3636，k=1171。显示的频域幅值如图2所示，从图中可以看出它是以x=32768/2对称的，而且除了1171一点之外，在坐标4000～5000之间还有一个峰值。此外，由我们在“离散傅里叶变换”学习的相关知识，可以得到这两个峰值所代表的频率是，所以接着运行以下语句：
　　[m2，k2]=max（abs（y（4000：5000）））；
　　n=32768；
　　f1=k*fs/n；
　　f2=（4000+k2）*fs/n
　　得结果m2=22.6522，k2=717。还求出第一个峰值所代表的频率为f1=787.9807，即787hz；第二个峰值所代表的频率为f2=（4000+717）/72768*fs，即为3174hz。这样就完成了对该声波主要频率的分析。
　　图1 信号的时域波形图2 信号频域的幅值
　　1.2 信号声音的重构
　　分析知道了该声波的频谱，接下来就可以得到它的时域值。当然可以使用傅立叶反变换，但在本例中将利用刚才分析的两个主要的频率成分来重构，执行下面的语句：
　　t=0：1/fs：1；
　　w1=[sin（2*pi*787*t）*1+sin（2*pi*3174*t）*（22/490）]*0.18；
　　sound（w1，fs，bits）
　　由于没有考虑相位和其他的频谱分量，所以波形和原来的波形相差较大，但大体的频谱是没有错的，通过听一下重构的声波，可以证实这一点。
　　2 wav文件的分段傅里叶分析
　　前面介绍了对wav文件直接进行一次性傅里叶变换的分析，但存在两个问题：第一，对分析的wav文件直接一次性做fft，点数太大，而实际运用中dsp的fft的点数是有限的，一般只能达到千点；第二，语音是分音节的，应该对它分段分析，所以下面引入分段处理数据，并连接每个段的频域结果。仍以前面讨论的“ding.wav”为例，进行分段傅里叶分析。
　　首先我们通过执行以下语句来显示wav文件的时域波形：
　　[w，fs，bits]=wavread（'c：＼windows＼media＼ding.wav'）；
　　plot（w（：，1））
　　结果是显示的波形与图1一样。
　　接下来我们作1024点的分段fft，通过执行以下语句来实现：
　　u=w（：，1）；
　　length（u）/1024
　　z=zeros（20，1024）
　　for i=1：19；
　　z（i，：）=（fft（u（1024*（i-1）+1：1024*i），1024））'；
　　end；
　　z（20，：）=（fft（u（1024*19+1：length（u）），1024））'；
　　mesh（abs（z）'）；figure；
　　mesh（abs（z（：，1：200））'）
　　（a）频域幅值变化图（b）频域幅值变化细节图
　　图3 分段后频域幅值变化图
　　运行结果如图3所示。x坐标表示段数，y坐标表示每段的点数，z坐标表示幅值大小。图3（a）每段1024点的频域幅值变化情况，可以看出它是以y=1024/2=512为对称的。为了更清楚地看到频域幅值变化的细节情况，图3（b）给出了每段200个点的波形。可以清楚地看到，首先沿y方向，整个wav数据分成的19个段中，每一段都有两个峰值，但幅度相差较大，该结果与图示一致的。再沿x方向看，分成

19个段中同一y位置的波形峰值幅度也是不一样的，呈波浪起伏变化，这也说明语音是分音节的。
　　下面做的是将图形中的两个主要谱线合成，执行下面的语句：
　　[m，i]=max（abs（z（：，1：200）'））；
　　[m2，i2]=max（abs（z（：，100：200）'））；
　　i2=i2+100；
　　t=[1：1024]*fs；
　　for j=1：20 u（1024*j-1023：1024*j）=m（j）*sin（i（j）/1024*fs*t）+m2（j）*sin（i2（j）/1024*fs*t）；
　　end；
　　u=u/35；
　　plot（u（1：2：length（u）））；
　　sound（u，fs，bits）；
　　（a）采用两个主要谱线合成后的波形（b）采用线性差值平滑后的波形
　　图4 合成波形及线性差值平滑波形
　　画出两个主要谱线合成后的波形，如图4（a）所示，并听听声音。
　　此时的声音听起来很刺耳，而且分辨不出原来的语音，但是可以感受到其音高的变化了。接下来用线性差值来平滑波形，得到的波形如图4（b）所示，执行下面的语句并听声音：
　　for j=2：20；
　　u（1024*j-1023：1024*j）=linspace（m（j-1），m（j），1024）.*sin（i（j）/1024*fs*t）+linspace（m2（j-1），m2（j），1024）.*sin（i2（j）/1024*fs*t）；
　　end；
　　u=u/35；
　　plot（u（1：2：length（u）））；
　　sound（u，fs，bits）；
　　这时的声音柔和了一些，但还是分辨不出原来的声音。合成的声音和原来的声音的区别主要在于这里只是抽取了峰值，没有考虑峰值边上的波的形状，也没有考虑相位的关系。但如果把它们全部考虑进去，这就要用到傅里叶反变换（ifft），所以继续进行分析和合成，执行下面的语句：
　　for j=1：20；
　　u（1024*j-1023：1024*j）=fliplr（real（ifft（z（j，：），1024）））；
　　end；
　　u=u/35；
　　plot（u）；
　　title（'采用ifft得到的波形'）；
　　sound（u，fs，bits）；
　　所得波形如图5所示，可见波形和原始波形一致，这时听到的声音和原来的声音就相同了。
　　图5 采用傅里叶变换得到的波形
　　3 结语
　　以上通过引入简单的wav文件作为分析对象，以matlab及快速傅里叶变换为分析工具，简要介绍了应用数字信号处理技术对wav信号文件进行分析的方法。可以预见，随着计算机技术、数字信号处理技术和大规模集成电路的迅速发展，数字信号处理的进步将在信号分析处理中得到更为广泛的应用。
　　【参考文献】
　　[1]王艳芬.快速傅里叶变换信号分析实例[m].人民邮电出版社.
　　[2]曹弋.matlab教程[m].机械工业出版社.
　　[责任编辑：丁艳]

论文网首页\|会计论文\|管理论文\|计算机论文\|医药学\|经济学论文\|法学论文\|社会学论文\|文学论文\|教育论文\|理学论文\|工学论文\|艺术论文\|哲学论文\|文化论文\|外语论文\|论文格式

		用户注册设为首页
	您现在的位置：论文大全网 >> 工科论文 >> 建筑工程论文 >> 正文	会员中心
通信学论文交通运输论文工业设计论文环境工程论文电力电气论文水利工程论文材料工程论文建筑工程论文化学工程论文机械工程论文电子信息工程论文建筑期刊工科综合论文汽车制造