第一节 回声消除原理
声学回声消除主要用来解决双端通信中回声干扰的问题。如下图所示,A、B两段正在进行远程语音通话,B端语音被麦克风采集后转换成电信号,经过网络传输到达A端,由A端扬声器播放出来,如果...
第三章 语音端点检测(VAD)
WebRTC中集成了基于RNN模型的VAD检测算法,该方法也作为WebRTC新一代AGC算法的一个子模块而存在。
第一节 特征选取
一个好的VAD特征应该具备以下特性:
区分能力:含噪...
本部分知识基于葛世超等人著《实时语音处理实践指南》一书进行整理。第一章 信号处理
第一节 语音基础知识
语音信号是实信号。语音信号是时变的,每秒约产生10个音节,所以在10~30ms内可以看成是准静态的...
在实现维纳滤波器和预测器的时候,需要计算数据的自相关矩阵的逆。但是当数据量比较大的时候,计算矩阵的逆花费的代价比较大,所以需要使用Levinson-Durbin算法来实现系数的求解。
一、数据模型
k阶前项维...
Opus库生成
将Opus库clone之后,找到目录中的win32文件夹,里面有一个vs2015目录,点击这里面的opus.sln,就会打开Opus的VS工程,如果你的VS版本是2017及以上,会提示你升级版本,这个时候确认就好了(如下图所示...
总览
Opus是一款完全开放的功能广泛的音频编解码器。Opus在互联网上的交互式语音和音乐传输方面无可匹敌,但也适用于存储和流媒体应用程序。它由Internet工程任务组(IETF)标准化为RFC 6716 ,该标准融合了Skype...
可以使用HTK中的HResults模块来计算WER(字错误率)。下面从HTK安装开始一点点为大家讲解如何使用。
本文参考网上的各种教程,属于个人原创,如需转载,请标明出处和本文地址。
本文主要由以下部分组成:
...
Investigation on LP-residual representations for speaker
identification
M. Chetouani, M.Faundez-Zanuy, B.Gas,
J.L.Zarader
摘要
特征提取是语音识别系统的必要和重要的步骤...
1 设计WebRTC的目的
WebRTC(Web Real-Time Communication)项目的最终目的主要是让Web开发者能够基于浏览器(Chrome\FireFox...)轻易快捷开发出丰富的实时多媒体应用,而无需下载安装任何插件,Web开发者也...