小奥的学习笔记

  • Home
  • Learning & Working
    • Speech Enhancement Notes
    • Programming language
    • Computer & DL
    • MOOC
  • Life
    • Life Time
    • Thinking & Comprehension
    • Volunteer
    • Plan
    • Travel
  • Footprints
  • GuestBook
  • About
    • About Me
    • 个人履历
    • 隐私策略
WebRTC
语音处理学习笔记

基于WebRTC的单通道语音增强系统发布第二个版本

这是一个基于WebRTC的单通道语音增强系统,其为浮点版本。 该工程包括: common_audio:处理音频所需要的文件在的文件夹。 ns:Noise Suppression处理的核心文件在的文件夹 dr_wav.h:读取和解析wav文件。 main.c:整个程序的主程序,系统的入口。 timing.h:计时使用的头文件。 本工程具体算法流程图及函数解释详见链接1和链接2。 V2.0更新记录: 将原来参考的程序文件全部替换为从WebRTC中提取的文件,更加忠实于原工程版本。 将程序中所有使用C++类的部分、使用函…

2019年9月1日 0条评论 1644点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

WebRTC中AGC模块分析(下)

本次更新的是WebRTC中AGC模块的具体函数的流程图和介绍,内容较多,所以可能错误也比较多,如果有问题,可以留言给我指出。非常感谢大家的支持! 3.AGC的函数介绍 3.1 WebRtcAgc_Process()函数 这一部分是WebRTC的自动增益控制模块的核心程序,如图3.1所示,主要分为以下5个步骤: 首先要判断采样点数是否符合规定的要求。即若采样率为8000Hz,则一帧长度必须为80个点;若采样率为16000Hz或32kHz或48kHz,则长度必须为160个点。否则就会返回错误退出。 其次要初始化satu…

2019年8月13日 0条评论 3086点热度 4人点赞 yszhang 阅读全文
语音处理学习笔记

WebRTC中AGC模块分析(上)

拖了快一个月了,终于有时间来将所研究的WebRTC中的自动增益控制(AGC)模块的内容进行下系统的整理。目前个人了解的还很初步,有很多东西还没有研究透彻,所以这部分分析整理可能会比较浅薄,后续随着研究的深入,内容会不断完善。 本次先更新第一部分,包括WebRTC的AGC模块的介绍、框图、函数关系图和函数功能介绍等。下一期更新具体的函数原理内容。 1.AGC模块的简介和性能结果 WebRTC的音频处理模块分为语音活动检测(VAD)、降噪(NS和NSX)、回音消除(AEC)、回声控制(AECM)和音频增益(AGC)等5…

2019年8月12日 4条评论 7414点热度 4人点赞 yszhang 阅读全文
语音处理学习笔记

WebRTC VAD模块分析

WebRTC Voice Activity Detection 1 关于WebRTC VAD 1.1 WebRTC VAD简介 其实在WebRTC的VAD中用到了一个很重要的方法的思想,这个方法就是聚类。实际上我们都可以知道,分出来的只有两个类,一是语音二是噪声。我们要对每一帧信号都求语音和噪声的概率,然后根据概率来进行聚类。那么,选择怎样的特征来作为高斯分布的输入呢?这种特征的选取可是关系着VAD性能是好是坏。我们的思想就是寻找噪声和语音相差最大的特征,或者说尽可能大的特征。 众所周知,信号的处理分类主要有时域、…

2019年7月15日 3条评论 4126点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

Single Channel Noise Suppression based on WebRTC

程序名称:Single Channel Noise Suppression based on WebRTC 程序来源:Google WebRTC(Web Real Time Communication) 程序语言:C 程序平台:Windows(VS2015+)/CentOS6.4(GCC) 程序功能简介: 此程序为一个单通道的语音增强程序,可以实现去除单麦克风采集到的语音中的噪声的功能。该程序提取自Google的开源视频会议框架WebRTC。 程序效果: Test Condition Key Value File …

2019年7月11日 0条评论 1253点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

Processing of WebRTC noise suppression

计算噪声功率谱程序(WebRtcNs_AnalyzeCore) 计算信噪比函数之前的部分分别是: 1.对输入的时域帧数据进行加窗、FFT变换。 2.然后计算能量,若能量为0,返回;否则继续往下。 3.然后计算新的能量和幅度。 4.使用分位数噪声估计进行初始噪声估计。 5.然后取前50个帧,计算得到高斯白噪声、粉红噪声模型,联合白噪声、粉红噪声模型,得到建模的混合噪声模型。 计算信噪比(ComputeSnr) 作用:根据分位数噪声估计计算前后信噪比 Inputs: |magn|.信号幅度谱估计 |noise| 噪声幅…

2019年7月1日 5条评论 3978点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

WebRTC Noise Suppression逻辑关系图

最近对Google开源的WebRTC中的噪声消除部分进行了细致的研究,然后绘制了WebRTC Noise Suppression逻辑关系图。因为时间仓促,可能逻辑关系图会有一些问题,如有问题,欢迎在文章下面给我留言,也可以在微信公众号下给我留言。由于某些关系,这些图片就在博客发布,技术博客和公众号就不发布了,虽然与自己研究的实际内容关系不大且代码本身都是免费获得的,但是也是我的劳动成果,如果有转发,请经过我的允许。谢谢。 系统总体关系图 初始化 设置去噪级别 分析模块 处理模块

2019年5月19日 2条评论 2747点热度 4人点赞 yszhang 阅读全文
12
搜索
欢迎关注我的个人公众号
最新 热点 随机
最新 热点 随机
DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 奥地利匈牙利九日游旅程 论文阅读之Study of the General Kalman Filter for Echo Cancellation 小奥看房之鸿荣源珈誉府 杭州往返旅途及西溪喜来登和万怡的体验报告 2022年的第一篇碎碎念
DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架
2017 CSL 1st: Shandong Luneng Taishan F.C VS Tianjin Elion Taida F.C 凌源高中——鬼娃娃的传说TXT下载 2011中国国际航空体育节飞行表演活动日程安排 某些字幕组的某些人,注意! 数据结构【浙江大学】(第10节)整理 《鸟哥的Linux私房菜》(基础篇)笔记整理(第6章)Part.1
标签聚合
Python 高中 生活 python学习 leetcode 鸟哥的linux私房菜 算法 Java linux 学习
最近评论
davidcheung 发布于 10 个月前(02月09日) The problem has been fixed. May I ask if you can s...
tk88 发布于 11 个月前(02月07日) Hmm is anyone else having problems with the pictur...
cuicui 发布于 1 年前(10月20日) :wink:
niming 发布于 1 年前(09月19日) 同级校友,能刷到太巧了
davidcheung 发布于 2 年前(08月16日) 我得找一下我之前整理的word文档看一下,如果找到了我就更新一下这篇文章。
Nolan 发布于 2 年前(07月25日) 您的笔记非常有帮助。贴图不显示了,可以更新一下吗?
davidcheung 发布于 4 年前(06月19日) 到没有看webrtc的代码。现在主要在看我们公司的代码了。。。只是偶尔看一看webrtc的东西。。。
aobai 发布于 4 年前(03月13日) gain_change_hangover_ 应该是每三个block 只能够调整一次,这样保证每帧...
匿名 发布于 5 年前(12月30日) 烫
小奥 发布于 5 年前(12月12日) webRTC里面的NS本身我记得就是在C++里面呀

COPYRIGHT © 2025 小奥的学习笔记. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

陕ICP备19003234号-1

鲁公网安备37120202000100号