小奥的学习笔记

  • Home
  • Learning & Working
    • Speech Enhancement Notes
    • Programming language
    • Computer & DL
    • MOOC
  • Life
    • Life Time
    • Thinking & Comprehension
    • Volunteer
    • Plan
    • Travel
  • Footprints
  • GuestBook
  • About
    • About Me
    • 个人履历
    • 隐私策略
语音处理
语音处理学习笔记

AEC个人学习串讲之fullaec.m:非线性处理(下)

取消大小周了,周末有了更多的时间来自己学习。给自己立个flag,两周内把fullaec.m里面的线性滤波器、NLP等部分弄懂,发博客;再2~3周的时间看webrtc的AEC3的代码,同样发博客整理;然后再2~3周的时间看一下speex里面的AEC算法。 本次继续更新非线性处理部分。在学习过程中,参考了《实时语音处理实践指南》相关内容和网上有关博客的内容,在此对相关作者表示感谢。 非线性处理部分 计算完hnled,接下来开始计算ovrd。 hnlLocalMin是对hnlPrefAvgLow的最小值跟踪,其初始值为1…

2021年8月22日 1条评论 2212点热度 3人点赞 davidcheung 阅读全文
语音处理学习笔记

AEC个人学习串讲之fullaec.m:非线性处理(上)

取消大小周了,周末有了更多的时间来自己学习。给自己立个flag,两周内把fullaec.m里面的线性滤波器、NLP等部分弄懂,发博客;再2~3周的时间看webrtc的AEC3的代码,同样发博客整理;然后再2~3周的时间看一下speex里面的AEC算法。 本次更新非线性处理部分。在学习过程中,参考了《实时语音处理实践指南》相关内容和网上有关博客的内容,在此对相关作者表示感谢。 非线性处理 非线性处理的主要思想: WebRTC是利用信号之间的频域相干性c(0<=c<=1)来衡量误差信号中残留回声的大小的。首…

2021年8月15日 2条评论 2824点热度 4人点赞 davidcheung 阅读全文
语音处理学习笔记

《实时语音处理实践指南》学习笔记:第三章

第三章 语音端点检测(VAD) WebRTC中集成了基于RNN模型的VAD检测算法,该方法也作为WebRTC新一代AGC算法的一个子模块而存在。 第一节 特征选取 一个好的VAD特征应该具备以下特性: 区分能力:含噪语音和仅含噪声音频的分离度应该尽可能的大。理论上的最好效果是让语音特征和噪声特征没有交集(实际很难,因为会有相似) 噪声鲁棒性:背景噪声会造成语音失真,这会影响提取的特征区分能力。 基于能量的特征:基于能量的方法可以将宽带语音分成各个子带,求各个子带的能量。这是因为语音在2kHz以下频带含有大量的能量,…

2020年10月17日 1条评论 3135点热度 0人点赞 davidcheung 阅读全文
语音处理学习笔记

《实时语音处理实践指南》学习笔记:第一章

本部分知识基于葛世超等人著《实时语音处理实践指南》一书进行整理。第一章 信号处理 第一节 语音基础知识 语音信号是实信号。 语音信号是时变的,每秒约产生10个音节,所以在10~30ms内可以看成是准静态的。 为什么要加窗处理? 答:对连续的语音分帧做STFT处理,等价于截取一段时间信号,对其进行周期延拓,从而变成无限长序列,然后对该无限长序列做FFT变换,但是这一截断并不符合傅里叶变换的定义,因此会导致频谱泄露和混叠。泄露会导致幅度较小的频点淹没在幅度较大的频点泄漏分量重,而混叠会在分段拼接处引入虚假的峰值,进而不…

2020年9月30日 1条评论 2619点热度 1人点赞 davidcheung 阅读全文
语音处理学习笔记

WebRTC中AGC模块分析(上)

拖了快一个月了,终于有时间来将所研究的WebRTC中的自动增益控制(AGC)模块的内容进行下系统的整理。目前个人了解的还很初步,有很多东西还没有研究透彻,所以这部分分析整理可能会比较浅薄,后续随着研究的深入,内容会不断完善。 本次先更新第一部分,包括WebRTC的AGC模块的介绍、框图、函数关系图和函数功能介绍等。下一期更新具体的函数原理内容。 1.AGC模块的简介和性能结果 WebRTC的音频处理模块分为语音活动检测(VAD)、降噪(NS和NSX)、回音消除(AEC)、回声控制(AECM)和音频增益(AGC)等5…

2019年8月12日 4条评论 7005点热度 4人点赞 davidcheung 阅读全文
语音处理学习笔记

深度学习及其在语音处理中的应用综述

1. 前言 人工智能是当前的一个热点话题,从当前Google旗下的AlphaGO到智能汽车,人工智能已经步入我们生活的方方面面。 机器学习是一种实现人工智能的方法,这种方法是用算法来分析数据,然后从中学习,最后对现实做出预测和决策。而深度学习,则是机器学习的一种技术。从上个世纪七八十年代BP算法的出现及其在神经网络中的应用,很大推进了机器学习的发展。这种算法基于梯度下降法基础之上,并且适合于多层神经网络之中。这个阶段只包含一层隐藏层节点,因此此阶段被称为浅层学习。到2006年以后,随着研究的继续深入,模型包含层次越…

2017年8月20日 0条评论 1739点热度 0人点赞 davidcheung 阅读全文
搜索
欢迎关注我的个人公众号
最新 热点 随机
最新 热点 随机
DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 奥地利匈牙利九日游旅程 论文阅读之Study of the General Kalman Filter for Echo Cancellation 小奥看房之鸿荣源珈誉府 杭州往返旅途及西溪喜来登和万怡的体验报告 2022年的第一篇碎碎念
奥地利匈牙利九日游旅程DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架
猜灯谜(Riddle Guessing) 网站新域名yushuai.me正式启用 继续在微机课写日志 第一次使用git更新github过程和遇到的问题 随机漫步模型之python实现 莱芜市2012年普通高中招生工作实施意见2
标签聚合
生活 leetcode Java linux python学习 鸟哥的linux私房菜 学习 高中 算法 Python
最近评论
davidcheung 发布于 5 个月前(02月09日) The problem has been fixed. May I ask if you can s...
tk88 发布于 5 个月前(02月07日) Hmm is anyone else having problems with the pictur...
cuicui 发布于 9 个月前(10月20日) :wink:
niming 发布于 10 个月前(09月19日) 同级校友,能刷到太巧了
davidcheung 发布于 2 年前(08月16日) 我得找一下我之前整理的word文档看一下,如果找到了我就更新一下这篇文章。
Nolan 发布于 2 年前(07月25日) 您的笔记非常有帮助。贴图不显示了,可以更新一下吗?
davidcheung 发布于 3 年前(06月19日) 到没有看webrtc的代码。现在主要在看我们公司的代码了。。。只是偶尔看一看webrtc的东西。。。
aobai 发布于 3 年前(03月13日) gain_change_hangover_ 应该是每三个block 只能够调整一次,这样保证每帧...
匿名 发布于 5 年前(12月30日) 烫
小奥 发布于 5 年前(12月12日) webRTC里面的NS本身我记得就是在C++里面呀

COPYRIGHT © 2025 小奥的学习笔记. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

陕ICP备19003234号-1

鲁公网安备37120202000100号