小奥的学习笔记

  • Home
  • Learning & Working
    • Speech Enhancement Notes
    • Programming language
    • Computer & DL
    • MOOC
  • Life
    • Life Time
    • Thinking & Comprehension
    • Volunteer
    • Plan
    • Travel
  • Footprints
  • GuestBook
  • About
    • About Me
    • 个人履历
    • 隐私策略
语音处理学习笔记
语音处理学习笔记

WebRTC VAD模块分析

WebRTC Voice Activity Detection 1 关于WebRTC VAD 1.1 WebRTC VAD简介 其实在WebRTC的VAD中用到了一个很重要的方法的思想,这个方法就是聚类。实际上我们都可以知道,分出来的只有两个类,一是语音二是噪声。我们要对每一帧信号都求语音和噪声的概率,然后根据概率来进行聚类。那么,选择怎样的特征来作为高斯分布的输入呢?这种特征的选取可是关系着VAD性能是好是坏。我们的思想就是寻找噪声和语音相差最大的特征,或者说尽可能大的特征。 众所周知,信号的处理分类主要有时域、…

2019年7月15日 3条评论 3839点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

Single Channel Noise Suppression based on WebRTC

程序名称:Single Channel Noise Suppression based on WebRTC 程序来源:Google WebRTC(Web Real Time Communication) 程序语言:C 程序平台:Windows(VS2015+)/CentOS6.4(GCC) 程序功能简介: 此程序为一个单通道的语音增强程序,可以实现去除单麦克风采集到的语音中的噪声的功能。该程序提取自Google的开源视频会议框架WebRTC。 程序效果: Test Condition Key Value File …

2019年7月11日 0条评论 1163点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

Processing of WebRTC noise suppression

计算噪声功率谱程序(WebRtcNs_AnalyzeCore) 计算信噪比函数之前的部分分别是: 1.对输入的时域帧数据进行加窗、FFT变换。 2.然后计算能量,若能量为0,返回;否则继续往下。 3.然后计算新的能量和幅度。 4.使用分位数噪声估计进行初始噪声估计。 5.然后取前50个帧,计算得到高斯白噪声、粉红噪声模型,联合白噪声、粉红噪声模型,得到建模的混合噪声模型。 计算信噪比(ComputeSnr) 作用:根据分位数噪声估计计算前后信噪比 Inputs: |magn|.信号幅度谱估计 |noise| 噪声幅…

2019年7月1日 5条评论 3683点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

学术报告:From Matrix to Tensor: Algorithm and Hardware Co-Design for Energy-Efficient Deep Learning

学术报告笔记整理 学术报告题目:From Matrix to Tensor: Algorithm and Hardware Co-Design for Energy-Efficient Deep Learning 主讲人:袁博(Bo Yuan, Assistant professor in the Department of Electrical and Computer Engineering in Rutgers University) 发展背景     深度学习应用广泛,但是目前…

2019年6月27日 0条评论 1436点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

语音信号处理笔记(2)

语音和阵列信号的基础 以下内容均为自己有关文献和论文整理,因为部分公式较难打出,所以整理成了图片。 语音信号及特点 1.语音信号的几大特点: 噪声场 不同噪声场中的噪声之间的相关程度不一样。定义噪声相关函数如下: 一般认为,在不考虑噪声的散射、幅度衰减等的情况下,相干噪声场中噪声直达各个麦克风。实际中,开放的、没有混响的环境通常为相干噪声场;非相干噪声场中,噪声互不相干,理想的非相干噪声场实际环境很少见,通常认为麦克风产生的电子噪声为非相干噪声。许多实际噪声环境可以看作散射场,如室内、车内环境等。 近场和远场 区分…

2019年6月23日 1条评论 1586点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

MATLAB绘制语谱图代码

分享MATLAB绘制语谱图代码如下: close all; clear all; %原始语音通道1 [orign,Fs]=audioread('6ch_zys_n1_50cm4_mvdr.wav'); to=(1:length(orign(:,1)))/Fs; figure(); h1=plot(to,orign(:,1)); h1_axis=gca; xlabel(h1_axis,'时间(s)'),ylabel(h1_axis,'幅度'),title(h1_axis,'MVDR算法时域图'); figure();…

2019年6月23日 0条评论 1065点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

语音信号处理学习笔记(1):语音的基本知识

1.声音三要素:音调、音色、响度。 2.汉明窗的好处:选择一个窗函数主要是看它的主瓣宽度和旁瓣衰减,理论上主瓣宽度越窄越好,旁瓣衰减越大越好。汉明窗是相比来说性能比较好的一个窗函数,比如矩形窗,虽然主瓣宽度较窄,但是旁瓣衰减不如汉宁窗,所以谱泄漏比较严重。综合考虑来说汉明窗最好。 3.为何分帧:语音具有短时平稳性,但是长期来看并不平稳,为了利用这种平稳性,所以需要进行分帧,大约10~30ms。 4.为何重叠:实现两帧之间的平滑过渡、保持其连续性。 5.语音端点检测方法(语音活动检测)——两级判决法 (1)第一级判决…

2019年5月25日 1条评论 1636点热度 0人点赞 yszhang 阅读全文
1…23456
搜索
欢迎关注我的个人公众号
最新 热点 随机
最新 热点 随机
DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 奥地利匈牙利九日游旅程 论文阅读之Study of the General Kalman Filter for Echo Cancellation 小奥看房之鸿荣源珈誉府 杭州往返旅途及西溪喜来登和万怡的体验报告 2022年的第一篇碎碎念
奥地利匈牙利九日游旅程DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架
Python chapter 5 learning notes 班级记忆百宝箱(216forever.com)暂停运营 [leetcode]roman to integer(罗马数字转整数) 递归读目录获取普通文件个数 下学期微机课的第一篇日志 关于个人博客域名修改的公告
标签聚合
学习 leetcode linux 高中 生活 Java 算法 Python 鸟哥的linux私房菜 python学习
最近评论
davidcheung 发布于 6 个月前(02月09日) The problem has been fixed. May I ask if you can s...
tk88 发布于 6 个月前(02月07日) Hmm is anyone else having problems with the pictur...
cuicui 发布于 10 个月前(10月20日) :wink:
niming 发布于 11 个月前(09月19日) 同级校友,能刷到太巧了
davidcheung 发布于 2 年前(08月16日) 我得找一下我之前整理的word文档看一下,如果找到了我就更新一下这篇文章。
Nolan 发布于 2 年前(07月25日) 您的笔记非常有帮助。贴图不显示了,可以更新一下吗?
davidcheung 发布于 3 年前(06月19日) 到没有看webrtc的代码。现在主要在看我们公司的代码了。。。只是偶尔看一看webrtc的东西。。。
aobai 发布于 3 年前(03月13日) gain_change_hangover_ 应该是每三个block 只能够调整一次,这样保证每帧...
匿名 发布于 5 年前(12月30日) 烫
小奥 发布于 5 年前(12月12日) webRTC里面的NS本身我记得就是在C++里面呀

COPYRIGHT © 2025 小奥的学习笔记. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

陕ICP备19003234号-1

鲁公网安备37120202000100号