小奥的学习笔记

  • Home
  • Learning & Working
    • Speech Enhancement Notes
    • Programming language
    • Computer & DL
    • MOOC
  • Life
    • Life Time
    • Thinking & Comprehension
    • Volunteer
    • Plan
    • Travel
  • Footprints
  • GuestBook
  • About
    • About Me
    • 个人履历
    • 隐私策略
DeepFilter
Deep Learning

DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架

摘要 传统方法通常使用时频掩码(TF mask)对含噪频谱图进行点乘处理,而复数值掩码(CM)因其能修正相位而优于时值掩码。近期很多研究提出使用复数值滤波器代替掩码点乘操作,通过利用频带内局部时间相关性,整合过去和未来时间步的信息。 这篇论文提出了DeepFilterNet,是一种基于深度滤波的两阶段语音增强框架。第一阶段利用ERB(等效矩形带宽)缩放的增益增强语音的频谱包络,模拟人耳听觉的频率感知特性;第二阶段通过深度滤波增强语音的周期性成分,除了利用语音的感知特性外,还通过可分离卷积和线性层/循环层中的分组策略…

2025年2月9日 0条评论 1317点热度 0人点赞 yszhang 阅读全文
搜索
欢迎关注我的个人公众号
最新 热点 随机
最新 热点 随机
【论文精读】Zipformer:如何重新定义语音识别编码器的效率与性能? WeNet: Production Oriented Streaming and Non-streaming End-to-End Speech Recognition Toolkit DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 奥地利匈牙利九日游旅程 论文阅读之Study of the General Kalman Filter for Echo Cancellation 小奥看房之鸿荣源珈誉府
WeNet: Production Oriented Streaming and Non-streaming End-to-End Speech Recognition Toolkit【论文精读】Zipformer:如何重新定义语音识别编码器的效率与性能?
leetcode题目解析(191024) 关于留学美国的一点想法 leetcode题目解析(191029) WIN10+anaconda+CUDA9.0+CUDNN7.0安装配置Tensorflow(GPU)教程 Leetcode:股票系列题目解析 2010 S.V Beijing Travel 14:Beijing Olympic Green&Apple Store
标签聚合
高中 Python python学习 算法 鸟哥的linux私房菜 生活 leetcode linux Java 学习
最近评论
davidcheung 发布于 1 年前(02月09日) The problem has been fixed. May I ask if you can s...
tk88 发布于 1 年前(02月07日) Hmm is anyone else having problems with the pictur...
cuicui 发布于 1 年前(10月20日) :wink:
niming 发布于 1 年前(09月19日) 同级校友,能刷到太巧了
davidcheung 发布于 3 年前(08月16日) 我得找一下我之前整理的word文档看一下,如果找到了我就更新一下这篇文章。
Nolan 发布于 3 年前(07月25日) 您的笔记非常有帮助。贴图不显示了,可以更新一下吗?
davidcheung 发布于 4 年前(06月19日) 到没有看webrtc的代码。现在主要在看我们公司的代码了。。。只是偶尔看一看webrtc的东西。。。
aobai 发布于 4 年前(03月13日) gain_change_hangover_ 应该是每三个block 只能够调整一次,这样保证每帧...
匿名 发布于 5 年前(12月30日) 烫
小奥 发布于 5 年前(12月12日) webRTC里面的NS本身我记得就是在C++里面呀

COPYRIGHT © 2025 小奥的学习笔记. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

陕ICP备19003234号-1

鲁公网安备37120202000100号