小奥的学习笔记

  • Home
  • Learning & Working
    • Speech Enhancement Notes
    • Programming language
    • Computer & DL
    • MOOC
  • Life
    • Life Time
    • Thinking & Comprehension
    • Volunteer
    • Plan
    • Travel
  • Footprints
  • GuestBook
  • About
    • About Me
    • 个人履历
    • 隐私策略
  1. 首页
  2. Study-notes
  3. Computer & DL
  4. 语音处理学习笔记
  5. 正文

《实时语音处理实践指南》学习笔记:第一章

2020年9月30日 2635点热度 1人点赞 1条评论

本部分知识基于葛世超等人著《实时语音处理实践指南》一书进行整理。第一章 信号处理

第一节 语音基础知识

  1. 语音信号是实信号。
  2. 语音信号是时变的,每秒约产生10个音节,所以在10~30ms内可以看成是准静态的。
  3. 为什么要加窗处理?

答:对连续的语音分帧做STFT处理,等价于截取一段时间信号,对其进行周期延拓,从而变成无限长序列,然后对该无限长序列做FFT变换,但是这一截断并不符合傅里叶变换的定义,因此会导致频谱泄露和混叠。泄露会导致幅度较小的频点淹没在幅度较大的频点泄漏分量重,而混叠会在分段拼接处引入虚假的峰值,进而不能获得准确的频谱情况。通过加窗可以抑制频谱泄漏和混叠。

  1. 在语音增强算法一般用FIR滤波器,是为了保持线性相位。

第二节 重叠相加和重叠保留法

  1. 重叠相加(OLA)和重叠保留(OLS)主要用于将无限长序列的傅里叶变换、卷积和滤波运算转换成若干子段的傅里叶变换、卷积和滤波运算,时域计算复杂度为O(n^2),频域为O(nlogn)。语音信号中一般在频域实现。
  2. 对于分段长度为L,滤波器长度为M的情况,通常选择L+M-1为2的倍数,以利用FFT加速运算。

第三节 加权重叠相加法(WOLA)

  1. 加权重叠相加法在IFFT变换之后还要对数据进行加权,加权使用窗函数来实现,然后安装FFT对应段再相加,重叠相加结果是最终结果。加窗的目的是减小截断效应带来的不利影响,以抑制帧边缘主观听感上的不连续性。常用的窗函数包括均方汉宁窗和均方布莱克曼窗。
  2. 不同窗具有的最优重叠长度不一致,布莱克曼哈里斯窗的最优重叠长度为窗长的66.1%,而汉明窗和汉宁窗则为50%。

第四节 语音预加重预加重技术是为了提高高频分辨率。例如speex在做AEC的时候,选择的预加重洗漱为0.9。常用预加重洗漱提高200Hz以上的频率成分。

本作品采用 知识共享署名 4.0 国际许可协议 进行许可
标签: 语音处理
最后更新:2020年9月30日

davidcheung

这个人很懒,什么都没留下

打赏 点赞
< 上一篇
下一篇 >

文章评论

razz evil exclaim smile redface biggrin eek confused idea lol mad twisted rolleyes wink cool arrow neutral cry mrgreen drooling persevering
取消回复

搜索
欢迎关注我的个人公众号
最新 热点 随机
最新 热点 随机
DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 奥地利匈牙利九日游旅程 论文阅读之Study of the General Kalman Filter for Echo Cancellation 小奥看房之鸿荣源珈誉府 杭州往返旅途及西溪喜来登和万怡的体验报告 2022年的第一篇碎碎念
奥地利匈牙利九日游旅程论文阅读之Study of the General Kalman Filter for Echo CancellationDEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架
中华帝国没落史 《计算机组成原理(下)》期末考试试题整理 好友动态 大二上学期期末考试复习计划 [leetcode]题目解析(190425) C++面向对象程序设计课程笔记(第三周)
标签聚合
生活 算法 高中 leetcode Java python学习 学习 Python linux 鸟哥的linux私房菜
最近评论
davidcheung 发布于 5 个月前(02月09日) The problem has been fixed. May I ask if you can s...
tk88 发布于 5 个月前(02月07日) Hmm is anyone else having problems with the pictur...
cuicui 发布于 9 个月前(10月20日) :wink:
niming 发布于 10 个月前(09月19日) 同级校友,能刷到太巧了
davidcheung 发布于 2 年前(08月16日) 我得找一下我之前整理的word文档看一下,如果找到了我就更新一下这篇文章。
Nolan 发布于 2 年前(07月25日) 您的笔记非常有帮助。贴图不显示了,可以更新一下吗?
davidcheung 发布于 3 年前(06月19日) 到没有看webrtc的代码。现在主要在看我们公司的代码了。。。只是偶尔看一看webrtc的东西。。。
aobai 发布于 3 年前(03月13日) gain_change_hangover_ 应该是每三个block 只能够调整一次,这样保证每帧...
匿名 发布于 5 年前(12月30日) 烫
小奥 发布于 5 年前(12月12日) webRTC里面的NS本身我记得就是在C++里面呀

COPYRIGHT © 2025 小奥的学习笔记. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

陕ICP备19003234号-1

鲁公网安备37120202000100号