小奥的学习笔记

  • Home
  • Learning & Working
    • Speech Enhancement Notes
    • Programming language
    • Computer & DL
    • MOOC
  • Life
    • Life Time
    • Thinking & Comprehension
    • Volunteer
    • Plan
    • Travel
  • Footprints
  • GuestBook
  • About
    • About Me
    • 个人履历
    • 隐私策略
Computer & DL
Deep Learning

DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架

摘要 传统方法通常使用时频掩码(TF mask)对含噪频谱图进行点乘处理,而复数值掩码(CM)因其能修正相位而优于时值掩码。近期很多研究提出使用复数值滤波器代替掩码点乘操作,通过利用频带内局部时间相关性,整合过去和未来时间步的信息。 这篇论文提出了DeepFilterNet,是一种基于深度滤波的两阶段语音增强框架。第一阶段利用ERB(等效矩形带宽)缩放的增益增强语音的频谱包络,模拟人耳听觉的频率感知特性;第二阶段通过深度滤波增强语音的周期性成分,除了利用语音的感知特性外,还通过可分离卷积和线性层/循环层中的分组策略…

2025年2月9日 0条评论 613点热度 0人点赞 davidcheung 阅读全文
语音处理学习笔记

论文阅读之Study of the General Kalman Filter for Echo Cancellation

信号模型 假设输入信号为: 【待本周末更新】 大家可以临时先看:飞书链接:https://qouwscohey.feishu.cn/docx/EeDSdR09Bo9QuWx04RIcHNBfnke 密码可以关注我的公众号“小奥的学习笔记”(也可以扫右侧的码)关注后,回复“GKF”或者“gkf”即可获得密码。

2023年12月11日 0条评论 992点热度 0人点赞 davidcheung 阅读全文
语音处理学习笔记

卡尔曼滤波器学习笔记:初步认识

参考视频:https://space.bilibili.com/230105574/ 阅读原文请访问:https://qouwscohey.feishu.cn/docs/doccnAtfHvdvbQZzj5YfXWX8Etd 第一节:递归算法 不确定性:①不存在完美的数学模型;②系统的扰动不可控,也很难建模;③测量传感器存在误差。 我们可以发现,随着k增大,1/k趋近于0,那么xk->xk-1。也就是说,随着k增加,测量结果不再重要。而k越小,1/k越大,zk的作用越大。 如果我们把1/k用一个参数Kk来代替…

2021年11月13日 0条评论 2215点热度 1人点赞 davidcheung 阅读全文
语音处理学习笔记

AEC个人学习串讲之AEC3:时延对齐、线性处理、非线性处理

计算参考信号和采集信号的时延:GetDelay() AEC3中的时延估计算法是使用计算滤波器能量最大块来作为延迟估计值,它是当滤波器收敛到一定程度时,计算所有滤波器系数的能量,取峰值的系数(tap)对应的delay就是对齐需要的delay。它是由步长为0.7的5个时域的NLMS滤波器组成,每个滤波器默认为32个块,每个块有16个样点,总计有32*16=512个样点,5个滤波器理论上共有512*5=2560个点,但实际上5个滤波器在时域上互相重叠8块(即输入的信号在时间上存在重叠),所以实际上5个滤波器可以估计256…

2021年10月17日 2条评论 5158点热度 8人点赞 davidcheung 阅读全文
语音处理学习笔记

AEC个人学习串讲之AEC3:概述及非核心部分

整体框图 参考信号:送往时延估计、AEC的状态计算 采集信号:送往时延估计、线性滤波器、AEC的状态计算 线性滤波器使用时延对齐后的参考信号和采集信号进行处理;线性滤波器处理后的结果送往NLP模块,最终得到处理结果。 类调用关系图 EchoCanceller3(入口) AnalyzeRender 该部分只是将AudioBuffer类型的参考信号insert到render_transfer_queue_,这是一个swapqueue,数据从结尾insert,从开头remove,这里没有什么可以说的【当然insert之前…

2021年10月17日 0条评论 3476点热度 8人点赞 davidcheung 阅读全文
语音处理学习笔记

AEC个人学习串讲之fullaec.m:非线性处理(下)

取消大小周了,周末有了更多的时间来自己学习。给自己立个flag,两周内把fullaec.m里面的线性滤波器、NLP等部分弄懂,发博客;再2~3周的时间看webrtc的AEC3的代码,同样发博客整理;然后再2~3周的时间看一下speex里面的AEC算法。 本次继续更新非线性处理部分。在学习过程中,参考了《实时语音处理实践指南》相关内容和网上有关博客的内容,在此对相关作者表示感谢。 非线性处理部分 计算完hnled,接下来开始计算ovrd。 hnlLocalMin是对hnlPrefAvgLow的最小值跟踪,其初始值为1…

2021年8月22日 1条评论 2206点热度 3人点赞 davidcheung 阅读全文
语音处理学习笔记

AEC个人学习串讲之fullaec.m:非线性处理(上)

取消大小周了,周末有了更多的时间来自己学习。给自己立个flag,两周内把fullaec.m里面的线性滤波器、NLP等部分弄懂,发博客;再2~3周的时间看webrtc的AEC3的代码,同样发博客整理;然后再2~3周的时间看一下speex里面的AEC算法。 本次更新非线性处理部分。在学习过程中,参考了《实时语音处理实践指南》相关内容和网上有关博客的内容,在此对相关作者表示感谢。 非线性处理 非线性处理的主要思想: WebRTC是利用信号之间的频域相干性c(0<=c<=1)来衡量误差信号中残留回声的大小的。首…

2021年8月15日 2条评论 2816点热度 4人点赞 davidcheung 阅读全文
12345…19
搜索
欢迎关注我的个人公众号
最新 热点 随机
最新 热点 随机
DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 奥地利匈牙利九日游旅程 论文阅读之Study of the General Kalman Filter for Echo Cancellation 小奥看房之鸿荣源珈誉府 杭州往返旅途及西溪喜来登和万怡的体验报告 2022年的第一篇碎碎念
奥地利匈牙利九日游旅程DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架
在本地和GitPage搭建Hexo博客系统 反思111111 科大讯飞提前批智能语音方向一面面经 WIN10+anaconda+CUDA9.0+CUDNN7.0安装配置Tensorflow(GPU)教程 欢迎大家学习由昆士兰大学提供的热带海岸线生态系统课程! 班级记忆百宝箱第一版网站架设完毕
标签聚合
高中 算法 Java python学习 学习 生活 linux Python 鸟哥的linux私房菜 leetcode
最近评论
davidcheung 发布于 5 个月前(02月09日) The problem has been fixed. May I ask if you can s...
tk88 发布于 5 个月前(02月07日) Hmm is anyone else having problems with the pictur...
cuicui 发布于 8 个月前(10月20日) :wink:
niming 发布于 9 个月前(09月19日) 同级校友,能刷到太巧了
davidcheung 发布于 2 年前(08月16日) 我得找一下我之前整理的word文档看一下,如果找到了我就更新一下这篇文章。
Nolan 发布于 2 年前(07月25日) 您的笔记非常有帮助。贴图不显示了,可以更新一下吗?
davidcheung 发布于 3 年前(06月19日) 到没有看webrtc的代码。现在主要在看我们公司的代码了。。。只是偶尔看一看webrtc的东西。。。
aobai 发布于 3 年前(03月13日) gain_change_hangover_ 应该是每三个block 只能够调整一次,这样保证每帧...
匿名 发布于 5 年前(12月30日) 烫
小奥 发布于 5 年前(12月12日) webRTC里面的NS本身我记得就是在C++里面呀

COPYRIGHT © 2025 小奥的学习笔记. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

陕ICP备19003234号-1

鲁公网安备37120202000100号