小奥的学习笔记

  • Home
  • Learning & Working
    • Speech Enhancement Notes
    • Programming language
    • Computer & DL
    • MOOC
  • Life
    • Life Time
    • Thinking & Comprehension
    • Volunteer
    • Plan
    • Travel
  • Footprints
  • GuestBook
  • About
    • About Me
    • 个人履历
    • 隐私策略
Deep Learning
Deep Learning

DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架

摘要 传统方法通常使用时频掩码(TF mask)对含噪频谱图进行点乘处理,而复数值掩码(CM)因其能修正相位而优于时值掩码。近期很多研究提出使用复数值滤波器代替掩码点乘操作,通过利用频带内局部时间相关性,整合过去和未来时间步的信息。 这篇论文提出了DeepFilterNet,是一种基于深度滤波的两阶段语音增强框架。第一阶段利用ERB(等效矩形带宽)缩放的增益增强语音的频谱包络,模拟人耳听觉的频率感知特性;第二阶段通过深度滤波增强语音的周期性成分,除了利用语音的感知特性外,还通过可分离卷积和线性层/循环层中的分组策略…

2025年2月9日 0条评论 668点热度 0人点赞 davidcheung 阅读全文
Deep Learning

吴恩达深度学习课程DeepLearning.ai笔记(5-3)

第三周:序列模型和注意力机制 3.1 基础模型 1.序列到序列模型 【参考文献:Sutskever et. al., 2014. Sequence to sequence learning with neural networks, Cho et. al., 2014. Learning phrase representations using RNN encoder-decoder for statistical machine translation】 如图1所示,那么怎样训练处一个网络来输入序列x和输出序列y…

2018年3月21日 0条评论 2422点热度 0人点赞 davidcheung 阅读全文
Deep Learning

吴恩达深度学习课程DeepLearning.ai笔记(5-2)

Project 5 Week3 自然语言处理与词汇嵌入 1 词汇表征 1. One-hot表征 one-hot表征的方式是对模型字典中的单词进行表征,对应单词的位置用1表示,其余位置用0表示,如图1所示:   图1 这种方法是存在缺点的,它将每个词孤立起来,使得模型对相关词的泛化能力不强,每个词向量之间的距离都一样,乘积均为0,所以无法获取词与词之间的相似性和关联性。 2.特征表征:词嵌入 这种方法是用不同的特征来对词汇进行表示,不同的单词在不同的特征下都有不同的取值,取值可以表示该词汇在该特征下的相似度…

2018年3月18日 0条评论 2016点热度 0人点赞 davidcheung 阅读全文
Deep Learning

吴恩达深度学习课程DeepLearning.ai笔记(5-1)

序列模型 1. Why sequence models? 在实际的生活中,很多东西都是序列信号,例如语音信号、音乐产生、情感分类、DNA序列分析等,这些虽然可以使用一般神经网络去完成,但就如同图像识别一样,那样去做太过于复杂,因此在这里引入了循环神经网络(RNN)。 2. Notation x:代表输入的语句,例如:Harry Potter and Herminone Granger invented a new spell.并且使用x<t>代表本句中第t个单词。 y:代表输出结果。例如上句中对人名进行…

2018年3月11日 0条评论 2164点热度 0人点赞 davidcheung 阅读全文
Deep Learning

吴恩达深度学习课程DeepLearning.ai笔记(4-4)

特殊应用:人脸识别和神经风格迁移 1.人脸识别(Face Recognition) 人脸识别包括两个部分: (1)验证(Verification) 输入图像,名字/ID;输出所输入的图像是不是所要验证的那个人。 (2)识别(Recognition) l  拥有K个人的数据库。 l  得到一个输入图像。 l  如果输入图像是这K个人之一,输出ID;否则的话,输出“未识别”。 人脸识别问题相对于人脸验证来说具有更高难度。对于一个验证系统来说,如果拥有99%的精确度,则这个系统已经有很高的精…

2018年3月7日 0条评论 1985点热度 0人点赞 davidcheung 阅读全文
Deep Learning

吴恩达深度学习课程DeepLearning.ai笔记(4-3)

卷积神经网络 — 目标检测 1. 目标定位&特征点检测-目标检测 图片检测的三个问题: (1)分类问题:区分图片是汽车亦或是其它; (2)目标定位:判断是否是汽车并确定其位置; (3)目标检测:源图中有多个不同的物体,分析确定该物体是什么并确定位置。 (1)目标分类与定位 如图1所示。Softmax后面可以有多个输出,其输出结果是各项目标的可能性。 定位最关键的就是输出图中红圈的中心点的坐标(bx,by),然后就是它的宽bw和高bh。通常以图片的左上角坐标为(0,0),右下角为(1,1)。 图1 …

2018年3月7日 0条评论 2047点热度 0人点赞 davidcheung 阅读全文
Deep Learning

吴恩达深度学习课程DeepLearning.ai笔记(4-2)

卷积神经网络 — 深度卷积模型 1. 经典的卷积网络 本节,吴恩达教授介绍了几种经典的神经网络模型,分别是LeNet、AlexNet、VGGNet,并且提到了后面要介绍的ResNet(残差网络)和Google的Inception。接下来对本节介绍的网络分别做一个简单的介绍。 (1)LeNet-5: 如图1 所示。LeNet-5主要针对灰度设计,所以其输入尺寸比较小,大小为32×32×1(灰度图像没有三维的RGB)。 图1 从图中可以看出,在LeNet的经典模式中:随着网络深度增加,图像的大小在缩小,但是通…

2018年3月5日 0条评论 1636点热度 0人点赞 davidcheung 阅读全文
1234
搜索
欢迎关注我的个人公众号
最新 热点 随机
最新 热点 随机
DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 奥地利匈牙利九日游旅程 论文阅读之Study of the General Kalman Filter for Echo Cancellation 小奥看房之鸿荣源珈誉府 杭州往返旅途及西溪喜来登和万怡的体验报告 2022年的第一篇碎碎念
奥地利匈牙利九日游旅程DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架
小花豆生活第-2天:“残酷”的军训! C++中的cin, cin.getline, getline等混合使用时不能输入直接执行下一行的问题 C++面向对象程序设计课程笔记(第七周) 杭州往返旅途及西溪喜来登和万怡的体验报告 编程知识点学习(1):字符串知识点 《超(下)》官网:“其他”页面完成
标签聚合
鸟哥的linux私房菜 linux 高中 python学习 leetcode 算法 Java Python 学习 生活
最近评论
davidcheung 发布于 5 个月前(02月09日) The problem has been fixed. May I ask if you can s...
tk88 发布于 5 个月前(02月07日) Hmm is anyone else having problems with the pictur...
cuicui 发布于 9 个月前(10月20日) :wink:
niming 发布于 10 个月前(09月19日) 同级校友,能刷到太巧了
davidcheung 发布于 2 年前(08月16日) 我得找一下我之前整理的word文档看一下,如果找到了我就更新一下这篇文章。
Nolan 发布于 2 年前(07月25日) 您的笔记非常有帮助。贴图不显示了,可以更新一下吗?
davidcheung 发布于 3 年前(06月19日) 到没有看webrtc的代码。现在主要在看我们公司的代码了。。。只是偶尔看一看webrtc的东西。。。
aobai 发布于 3 年前(03月13日) gain_change_hangover_ 应该是每三个block 只能够调整一次,这样保证每帧...
匿名 发布于 5 年前(12月30日) 烫
小奥 发布于 5 年前(12月12日) webRTC里面的NS本身我记得就是在C++里面呀

COPYRIGHT © 2025 小奥的学习笔记. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

陕ICP备19003234号-1

鲁公网安备37120202000100号