小奥的学习笔记

  • Home
  • Learning & Working
    • Speech Enhancement Notes
    • Programming language
    • Computer & DL
    • MOOC
  • Life
    • Life Time
    • Thinking & Comprehension
    • Volunteer
    • Plan
    • Travel
  • Footprints
  • GuestBook
  • About
    • About Me
    • 个人履历
    • 隐私策略
WebRTC
语音处理学习笔记

基于WebRTC的单通道语音增强系统发布第二个版本

这是一个基于WebRTC的单通道语音增强系统,其为浮点版本。 该工程包括: common_audio:处理音频所需要的文件在的文件夹。 ns:Noise Suppression处理的核心文件在的文件夹 dr_wav.h:读取和解析wav文件。 main.c:整个程序的主程序,系统的入口。 timing.h:计时使用的头文件。 本工程具体算法流程图及函数解释详见链接1和链接2。 V2.0更新记录: 将原来参考的程序文件全部替换为从WebRTC中提取的文件,更加忠实于原工程版本。 将程序中所有使用C++类的部分、使用函…

2019年9月1日 0条评论 1524点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

WebRTC中AGC模块分析(下)

本次更新的是WebRTC中AGC模块的具体函数的流程图和介绍,内容较多,所以可能错误也比较多,如果有问题,可以留言给我指出。非常感谢大家的支持! 3.AGC的函数介绍 3.1 WebRtcAgc_Process()函数 这一部分是WebRTC的自动增益控制模块的核心程序,如图3.1所示,主要分为以下5个步骤: 首先要判断采样点数是否符合规定的要求。即若采样率为8000Hz,则一帧长度必须为80个点;若采样率为16000Hz或32kHz或48kHz,则长度必须为160个点。否则就会返回错误退出。 其次要初始化satu…

2019年8月13日 0条评论 2854点热度 4人点赞 yszhang 阅读全文
语音处理学习笔记

WebRTC中AGC模块分析(上)

拖了快一个月了,终于有时间来将所研究的WebRTC中的自动增益控制(AGC)模块的内容进行下系统的整理。目前个人了解的还很初步,有很多东西还没有研究透彻,所以这部分分析整理可能会比较浅薄,后续随着研究的深入,内容会不断完善。 本次先更新第一部分,包括WebRTC的AGC模块的介绍、框图、函数关系图和函数功能介绍等。下一期更新具体的函数原理内容。 1.AGC模块的简介和性能结果 WebRTC的音频处理模块分为语音活动检测(VAD)、降噪(NS和NSX)、回音消除(AEC)、回声控制(AECM)和音频增益(AGC)等5…

2019年8月12日 4条评论 7084点热度 4人点赞 yszhang 阅读全文
语音处理学习笔记

WebRTC VAD模块分析

WebRTC Voice Activity Detection 1 关于WebRTC VAD 1.1 WebRTC VAD简介 其实在WebRTC的VAD中用到了一个很重要的方法的思想,这个方法就是聚类。实际上我们都可以知道,分出来的只有两个类,一是语音二是噪声。我们要对每一帧信号都求语音和噪声的概率,然后根据概率来进行聚类。那么,选择怎样的特征来作为高斯分布的输入呢?这种特征的选取可是关系着VAD性能是好是坏。我们的思想就是寻找噪声和语音相差最大的特征,或者说尽可能大的特征。 众所周知,信号的处理分类主要有时域、…

2019年7月15日 3条评论 3773点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

Single Channel Noise Suppression based on WebRTC

程序名称:Single Channel Noise Suppression based on WebRTC 程序来源:Google WebRTC(Web Real Time Communication) 程序语言:C 程序平台:Windows(VS2015+)/CentOS6.4(GCC) 程序功能简介: 此程序为一个单通道的语音增强程序,可以实现去除单麦克风采集到的语音中的噪声的功能。该程序提取自Google的开源视频会议框架WebRTC。 程序效果: Test Condition Key Value File …

2019年7月11日 0条评论 1146点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

Processing of WebRTC noise suppression

计算噪声功率谱程序(WebRtcNs_AnalyzeCore) 计算信噪比函数之前的部分分别是: 1.对输入的时域帧数据进行加窗、FFT变换。 2.然后计算能量,若能量为0,返回;否则继续往下。 3.然后计算新的能量和幅度。 4.使用分位数噪声估计进行初始噪声估计。 5.然后取前50个帧,计算得到高斯白噪声、粉红噪声模型,联合白噪声、粉红噪声模型,得到建模的混合噪声模型。 计算信噪比(ComputeSnr) 作用:根据分位数噪声估计计算前后信噪比 Inputs: |magn|.信号幅度谱估计 |noise| 噪声幅…

2019年7月1日 5条评论 3639点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

WebRTC Noise Suppression逻辑关系图

最近对Google开源的WebRTC中的噪声消除部分进行了细致的研究,然后绘制了WebRTC Noise Suppression逻辑关系图。因为时间仓促,可能逻辑关系图会有一些问题,如有问题,欢迎在文章下面给我留言,也可以在微信公众号下给我留言。由于某些关系,这些图片就在博客发布,技术博客和公众号就不发布了,虽然与自己研究的实际内容关系不大且代码本身都是免费获得的,但是也是我的劳动成果,如果有转发,请经过我的允许。谢谢。 系统总体关系图 初始化 设置去噪级别 分析模块 处理模块

2019年5月19日 2条评论 2609点热度 4人点赞 yszhang 阅读全文
12
搜索
欢迎关注我的个人公众号
最新 热点 随机
最新 热点 随机
DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 奥地利匈牙利九日游旅程 论文阅读之Study of the General Kalman Filter for Echo Cancellation 小奥看房之鸿荣源珈誉府 杭州往返旅途及西溪喜来登和万怡的体验报告 2022年的第一篇碎碎念
奥地利匈牙利九日游旅程DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架
在本地和GitPage搭建Hexo博客系统 生活点滴:杯具的高中作息时间表 中国享有对琉球群岛(日本称为“冲绳县”)的主权 We are ready!Welcome to Shandong! 计算机组成原理笔记第三章 Hexo安装中遇到的问题
标签聚合
高中 算法 Java leetcode python学习 学习 linux Python 鸟哥的linux私房菜 生活
最近评论
davidcheung 发布于 6 个月前(02月09日) The problem has been fixed. May I ask if you can s...
tk88 发布于 6 个月前(02月07日) Hmm is anyone else having problems with the pictur...
cuicui 发布于 9 个月前(10月20日) :wink:
niming 发布于 10 个月前(09月19日) 同级校友,能刷到太巧了
davidcheung 发布于 2 年前(08月16日) 我得找一下我之前整理的word文档看一下,如果找到了我就更新一下这篇文章。
Nolan 发布于 2 年前(07月25日) 您的笔记非常有帮助。贴图不显示了,可以更新一下吗?
davidcheung 发布于 3 年前(06月19日) 到没有看webrtc的代码。现在主要在看我们公司的代码了。。。只是偶尔看一看webrtc的东西。。。
aobai 发布于 3 年前(03月13日) gain_change_hangover_ 应该是每三个block 只能够调整一次,这样保证每帧...
匿名 发布于 5 年前(12月30日) 烫
小奥 发布于 5 年前(12月12日) webRTC里面的NS本身我记得就是在C++里面呀

COPYRIGHT © 2025 小奥的学习笔记. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

陕ICP备19003234号-1

鲁公网安备37120202000100号