小奥的学习笔记

  • Home
  • Learning & Working
    • Speech Enhancement Notes
    • Programming language
    • Computer & DL
    • MOOC
  • Life
    • Life Time
    • Thinking & Comprehension
    • Volunteer
    • Plan
    • Travel
  • Footprints
  • GuestBook
  • About
    • About Me
    • 个人履历
    • 隐私策略
Computer & DL
语音处理学习笔记

整理的一些关于麦克风阵列的知识点

前期为了准备面试,也是为了自己拓展一下知识,整理了一些麦克风阵列的知识,这些内容里面并不全,但是却是一些最为关注的点。在了解了这些内容之后,反而让我对自己的麦克风阵列语音增强的系统有了更多的认识,最重要的一点就是,过去单纯只考虑算法改进是无法真正做到一个好系统的,算法必须与硬件结构相结合,才能做出更好的系统。 为什么使用麦克风阵列? 麦克风系统可以在低噪声、无混响、距离声源很近的情况下获得符合语音识别需求的声音信号。但是,若声源距离麦克风距离较远,并且真实环境存在大量的噪声、多径反射和混响,导致拾取信号的质量下降,…

2019年8月5日 0条评论 2281点热度 1人点赞 yszhang 阅读全文
语音处理学习笔记

科大讯飞提前批智能语音方向一面面经

科大讯飞的面试很玄学,在7月初我投递了简历之后一直没有联系我,然后突然追一面试之前半个小时联系我,我说我有个面试稍等会儿恢复他电话。然后追一面试官迟到之后,我给那边回了电话,那边只是记录了我的姓名、籍贯和报名方向。然后在7月22日我在高铁上的时候,跟我预约了7月23日下午的面试,于是乎就开始面试了。 问题记录 1.项目存在哪些问题? 2.对于幅度失真的原理是什么? 3.没有尝试其它方法? 4.对于双声源乃至多声源如何进行处理? 问题解答 幅度失真是因为时延估计和噪声协方差矩阵不准确造成的。而之所以不准确是因为,时延…

2019年7月30日 0条评论 1830点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

WebRTC VAD模块分析

WebRTC Voice Activity Detection 1 关于WebRTC VAD 1.1 WebRTC VAD简介 其实在WebRTC的VAD中用到了一个很重要的方法的思想,这个方法就是聚类。实际上我们都可以知道,分出来的只有两个类,一是语音二是噪声。我们要对每一帧信号都求语音和噪声的概率,然后根据概率来进行聚类。那么,选择怎样的特征来作为高斯分布的输入呢?这种特征的选取可是关系着VAD性能是好是坏。我们的思想就是寻找噪声和语音相差最大的特征,或者说尽可能大的特征。 众所周知,信号的处理分类主要有时域、…

2019年7月15日 3条评论 4347点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

Single Channel Noise Suppression based on WebRTC

程序名称:Single Channel Noise Suppression based on WebRTC 程序来源:Google WebRTC(Web Real Time Communication) 程序语言:C 程序平台:Windows(VS2015+)/CentOS6.4(GCC) 程序功能简介: 此程序为一个单通道的语音增强程序,可以实现去除单麦克风采集到的语音中的噪声的功能。该程序提取自Google的开源视频会议框架WebRTC。 程序效果: Test Condition Key Value File …

2019年7月11日 0条评论 1336点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

Processing of WebRTC noise suppression

计算噪声功率谱程序(WebRtcNs_AnalyzeCore) 计算信噪比函数之前的部分分别是: 1.对输入的时域帧数据进行加窗、FFT变换。 2.然后计算能量,若能量为0,返回;否则继续往下。 3.然后计算新的能量和幅度。 4.使用分位数噪声估计进行初始噪声估计。 5.然后取前50个帧,计算得到高斯白噪声、粉红噪声模型,联合白噪声、粉红噪声模型,得到建模的混合噪声模型。 计算信噪比(ComputeSnr) 作用:根据分位数噪声估计计算前后信噪比 Inputs: |magn|.信号幅度谱估计 |noise| 噪声幅…

2019年7月1日 5条评论 4172点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

学术报告:From Matrix to Tensor: Algorithm and Hardware Co-Design for Energy-Efficient Deep Learning

学术报告笔记整理 学术报告题目:From Matrix to Tensor: Algorithm and Hardware Co-Design for Energy-Efficient Deep Learning 主讲人:袁博(Bo Yuan, Assistant professor in the Department of Electrical and Computer Engineering in Rutgers University) 发展背景     深度学习应用广泛,但是目前…

2019年6月27日 0条评论 1590点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

语音信号处理笔记(2)

语音和阵列信号的基础 以下内容均为自己有关文献和论文整理,因为部分公式较难打出,所以整理成了图片。 语音信号及特点 1.语音信号的几大特点: 噪声场 不同噪声场中的噪声之间的相关程度不一样。定义噪声相关函数如下: 一般认为,在不考虑噪声的散射、幅度衰减等的情况下,相干噪声场中噪声直达各个麦克风。实际中,开放的、没有混响的环境通常为相干噪声场;非相干噪声场中,噪声互不相干,理想的非相干噪声场实际环境很少见,通常认为麦克风产生的电子噪声为非相干噪声。许多实际噪声环境可以看作散射场,如室内、车内环境等。 近场和远场 区分…

2019年6月23日 1条评论 1746点热度 0人点赞 yszhang 阅读全文
1…34567…19
搜索
欢迎关注我的个人公众号
最新 热点 随机
最新 热点 随机
【论文精读】Zipformer:如何重新定义语音识别编码器的效率与性能? WeNet: Production Oriented Streaming and Non-streaming End-to-End Speech Recognition Toolkit DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 奥地利匈牙利九日游旅程 论文阅读之Study of the General Kalman Filter for Echo Cancellation 小奥看房之鸿荣源珈誉府
WeNet: Production Oriented Streaming and Non-streaming End-to-End Speech Recognition Toolkit【论文精读】Zipformer:如何重新定义语音识别编码器的效率与性能?
[leetcode]题目解析(190422) 莱芜市2011年普通高中招生工作实施意见2 个人用VB制作了一个计算器,大家来捧场吧 博客即日起开始“上云”啦! 2011年暑假北京之行暂定 通信工程学院2017年硕士研究生拟录取名单公示及领取调档函的通知
标签聚合
鸟哥的linux私房菜 Java Python 学习 leetcode linux 高中 生活 python学习 算法
最近评论
davidcheung 发布于 1 年前(02月09日) The problem has been fixed. May I ask if you can s...
tk88 发布于 1 年前(02月07日) Hmm is anyone else having problems with the pictur...
cuicui 发布于 1 年前(10月20日) :wink:
niming 发布于 1 年前(09月19日) 同级校友,能刷到太巧了
davidcheung 发布于 3 年前(08月16日) 我得找一下我之前整理的word文档看一下,如果找到了我就更新一下这篇文章。
Nolan 发布于 3 年前(07月25日) 您的笔记非常有帮助。贴图不显示了,可以更新一下吗?
davidcheung 发布于 4 年前(06月19日) 到没有看webrtc的代码。现在主要在看我们公司的代码了。。。只是偶尔看一看webrtc的东西。。。
aobai 发布于 4 年前(03月13日) gain_change_hangover_ 应该是每三个block 只能够调整一次,这样保证每帧...
匿名 发布于 5 年前(12月30日) 烫
小奥 发布于 5 年前(12月12日) webRTC里面的NS本身我记得就是在C++里面呀

COPYRIGHT © 2025 小奥的学习笔记. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

陕ICP备19003234号-1

鲁公网安备37120202000100号