小奥的学习笔记

  • Home
  • Learning & Working
    • Speech Enhancement Notes
    • Programming language
    • Computer & DL
    • MOOC
  • Life
    • Life Time
    • Thinking & Comprehension
    • Volunteer
    • Plan
    • Travel
  • Footprints
  • GuestBook
  • About
    • About Me
    • 个人履历
    • 隐私策略
Study-notes
语音处理学习笔记

Levinson-Durbin(莱文森-杜宾)算法的实现

在实现维纳滤波器和预测器的时候,需要计算数据的自相关矩阵的逆。但是当数据量比较大的时候,计算矩阵的逆花费的代价比较大,所以需要使用Levinson-Durbin算法来实现系数的求解。 一、数据模型 k阶前项维纳预测器: 对上述模型进行一下调整,可以得到 所以a(0)=1, 。 注意:在Levinson-Durbin算法中,求解的是a(i),不是w(i)。 二、Levinson-Durbin迭代算法的实现步骤 以下是迭代算法的步骤,其中m是预测器的阶数。 初始值: 其中r(i)是数据的自相关矩阵。

2020年5月13日 0条评论 2490点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

在Windows10+VS2019环境下编译Opus

Opus库生成 将Opus库clone之后,找到目录中的win32文件夹,里面有一个vs2015目录,点击这里面的opus.sln,就会打开Opus的VS工程,如果你的VS版本是2017及以上,会提示你升级版本,这个时候确认就好了(如下图所示,由于我在编写该文档的时候已经生成了opus库和libopusenc库,所以这里以opusfile库为例)。 在打开工程之后,点击“生成->生成解决方案”。待生成完成以后,会发现在当前目录下有了“Debug”目录,里面有下图的5个文件夹及关键的opus.lib文件,这就代表生成…

2020年5月7日 1条评论 2404点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

Opus编解码器简介

总览 Opus是一款完全开放的功能广泛的音频编解码器。Opus在互联网上的交互式语音和音乐传输方面无可匹敌,但也适用于存储和流媒体应用程序。它由Internet工程任务组(IETF)标准化为RFC 6716 ,该标准融合了Skype的SILK编解码器和Xiph.Org的CELT编解码器中的技术。 技术 Opus可以处理各种音频应用程序,包括IP语音,视频会议,游戏内聊天,甚至是远程直播音乐表演。它可以从低比特率的窄带语音扩展到高质量的立体声音乐。支持的特性有: 从6kb/s到510kb/s的比特率; 从8kHz(窄…

2020年4月8日 1条评论 2253点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

使用HTK中的HResults计算WER

可以使用HTK中的HResults模块来计算WER(字错误率)。下面从HTK安装开始一点点为大家讲解如何使用。 本文参考网上的各种教程,属于个人原创,如需转载,请标明出处和本文地址。 本文主要由以下部分组成: 一、HTK在Windows下的编译 二、使用HResults模块计算WER 一、HTK在Windows下的编译 HTK的下载地址为: http://htk.eng.cam.ac.uk/download.shtml 请注意,下载的时候需要先注册账号然后进行下载。在安装之前,请务必确定已经安装了Visual St…

2020年2月20日 1条评论 1887点热度 0人点赞 yszhang 阅读全文
语音处理学习笔记

[论文笔记]Investigation on LP-residual representations for speaker identification

Investigation on LP-residual representations for speaker identification M. Chetouani, M.Faundez-Zanuy, B.Gas, J.L.Zarader 摘要     特征提取是语音识别系统的必要和重要的步骤。在本文中,我们提出了通过利用诸如梅尔频率倒谱编码(MFCC)、线性预测倒谱编码(LPCC)的常规帖子和非常规特征来改进这些系统。该方法利用线性预测残差信号中存在的信息,特征从残差中提取,然后…

2020年1月31日 1条评论 2195点热度 0人点赞 yszhang 阅读全文
Leetcode

Leetcode题目解析(191217):20&22&32

Leetcode 20:有效的括号 题目描述 给定一个只包括 '(',')','{','}','[',']' 的字符串,判断字符串是否有效。 有效字符串需满足: 左括号必须用相同类型的右括号闭合。 左括号必须以正确的顺序闭合。 注意空字符串可被认为是有效字符串。 代码实现 bool isValid(string s) {     if (s.empty())         return true;     if (s.size() % 2 == 1)         return false;     stack…

2019年12月17日 0条评论 1445点热度 0人点赞 yszhang 阅读全文
Leetcode

Leetocde必做100道题及个人做题解析【更新完毕】

由于本博客里面的代码存在解析错误,导致>/;/&/<等符号无法被正常解析,故为了大家阅读时候的方便,下面表格里面的链接全部指向了个人的github博客,故访问速度可能会有一些慢,敬请谅解。 截止2019年12月17日,所有题目已经更新完毕。 最后更新日期:2019.12.17 # Title Difficulty Solution 1 两数之和 E Leetcode题目解析(191127):1&19&70&78&79&84 2 两数相加  M Leetcode题…

2019年12月17日 1条评论 2394点热度 0人点赞 yszhang 阅读全文
12345…72
搜索
欢迎关注我的个人公众号
最新 热点 随机
最新 热点 随机
【论文精读】Zipformer:如何重新定义语音识别编码器的效率与性能? WeNet: Production Oriented Streaming and Non-streaming End-to-End Speech Recognition Toolkit DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 奥地利匈牙利九日游旅程 论文阅读之Study of the General Kalman Filter for Echo Cancellation 小奥看房之鸿荣源珈誉府
WeNet: Production Oriented Streaming and Non-streaming End-to-End Speech Recognition Toolkit【论文精读】Zipformer:如何重新定义语音识别编码器的效率与性能?
数字信号处理慕课学习知识点总结 DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 [leetcode]题目解析(190513) 莱芜市2010年普通高中招生说明(摘要)2 自行建立Navigation.php,放弃WP-Pagenavi Bye, Chen Yi middle School
标签聚合
生活 Java 鸟哥的linux私房菜 高中 python学习 linux 学习 Python 算法 leetcode
最近评论
davidcheung 发布于 1 年前(02月09日) The problem has been fixed. May I ask if you can s...
tk88 发布于 1 年前(02月07日) Hmm is anyone else having problems with the pictur...
cuicui 发布于 1 年前(10月20日) :wink:
niming 发布于 2 年前(09月19日) 同级校友,能刷到太巧了
davidcheung 发布于 3 年前(08月16日) 我得找一下我之前整理的word文档看一下,如果找到了我就更新一下这篇文章。
Nolan 发布于 3 年前(07月25日) 您的笔记非常有帮助。贴图不显示了,可以更新一下吗?
davidcheung 发布于 4 年前(06月19日) 到没有看webrtc的代码。现在主要在看我们公司的代码了。。。只是偶尔看一看webrtc的东西。。。
aobai 发布于 4 年前(03月13日) gain_change_hangover_ 应该是每三个block 只能够调整一次,这样保证每帧...
匿名 发布于 5 年前(12月30日) 烫
小奥 发布于 5 年前(12月12日) webRTC里面的NS本身我记得就是在C++里面呀

COPYRIGHT © 2025 小奥的学习笔记. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

陕ICP备19003234号-1

鲁公网安备37120202000100号