小奥的学习笔记

  • Home
  • Learning & Working
    • Speech Enhancement Notes
    • Programming language
    • Computer & DL
    • MOOC
  • Life
    • Life Time
    • Thinking & Comprehension
    • Volunteer
    • Plan
    • Travel
  • Footprints
  • GuestBook
  • About
    • About Me
    • 个人履历
    • 隐私策略
Computer & DL
语音处理学习笔记

使用HTK中的HResults计算WER

可以使用HTK中的HResults模块来计算WER(字错误率)。下面从HTK安装开始一点点为大家讲解如何使用。 本文参考网上的各种教程,属于个人原创,如需转载,请标明出处和本文地址。 本文主要由以下部分组成: 一、HTK在Windows下的编译 二、使用HResults模块计算WER 一、HTK在Windows下的编译 HTK的下载地址为: http://htk.eng.cam.ac.uk/download.shtml 请注意,下载的时候需要先注册账号然后进行下载。在安装之前,请务必确定已经安装了Visual St…

2020年2月20日 1条评论 1541点热度 0人点赞 davidcheung 阅读全文
语音处理学习笔记

[论文笔记]Investigation on LP-residual representations for speaker identification

Investigation on LP-residual representations for speaker identification M. Chetouani, M.Faundez-Zanuy, B.Gas, J.L.Zarader 摘要     特征提取是语音识别系统的必要和重要的步骤。在本文中,我们提出了通过利用诸如梅尔频率倒谱编码(MFCC)、线性预测倒谱编码(LPCC)的常规帖子和非常规特征来改进这些系统。该方法利用线性预测残差信号中存在的信息,特征从残差中提取,然后…

2020年1月31日 1条评论 1904点热度 0人点赞 davidcheung 阅读全文
语音处理学习笔记

WebRTC整体架构分析

1 设计WebRTC的目的 WebRTC(Web Real-Time Communication)项目的最终目的主要是让Web开发者能够基于浏览器(Chrome\FireFox...)轻易快捷开发出丰富的实时多媒体应用,而无需下载安装任何插件,Web开发者也无需关注多媒体的数字信号处理过程,只需编写简单的Javascript程序即可实现。W3C等组织正在制定Javascript标准API,目前是WebRTC 1.0版本(2019年10月24日),Draft状态,网址:http://w3c.github.io…

2019年10月28日 1条评论 1844点热度 0人点赞 davidcheung 阅读全文
语音处理学习笔记

《优化阵列信号处理》学习笔记(第十章)

本次分享是个人阅读《优化阵列信号处理》一书最后一个章节,也是针对该书比较整体的学习笔记的最后一次更新了。 第十章:圆环阵阵列处理 10.1 引言 由于直线阵是一维阵,其波束响应围绕该直线轴对称,因此它只能估计目标的一维角度,而另一维角度是模糊的,也就出现线阵的左右舷模糊缺点。而要解决这一问题就要采用二维阵或者三维阵。 圆环阵是一种二维阵,它也具有轴对称特性,不过它以垂直于该圆环的直线为轴,这样就可以在其所在平面360°方位具有相同的目标探测与方位估计性能。 圆环阵由于其对称性,其常规波束形成响应可以表示为一个贝塞尔…

2019年10月25日 1条评论 1218点热度 1人点赞 davidcheung 阅读全文
语音处理学习笔记

《优化阵列信号处理》学习笔记(第五章)

第五章:稳健波束设计 除了原始的对角加载之外,另一类具有代表性的对角加载类方法是加权向量范数约束方法。由于该方法等同于白噪声增益约束,所以也称为白噪声增益月书法。不过,对角加载方法的最大问题是难以根据导向向量误差信息确定对角加载量大小。 后续有一些新的方法,能够真正有效利用导向向量误差信息,它们是根据导向向量误差椭圆精确计算对角加载量的大小。 5.1 对角加载法 5.2 加权向量范数约束法 5.3 最差性能最佳化法 5.4 协方差矩阵拟合法 5.5 总结 …… 受篇幅和格式限制,更多内容,请在百度云盘下载。感谢对我…

2019年10月21日 1条评论 1518点热度 0人点赞 davidcheung 阅读全文
Life Time

《优化阵列信号处理》学习笔记(第四章)

第四章:波束稳健性分析 在实际中,由于各种误差(如观察方向误差、阵型标定误差、通道幅度与相位误差等)的影响,造成导向向量存在误差;另外,由于接收数据协方差矩阵无法精确计算,只能通过接受数据进行估计,也不可避免的存在估计误差。导向向量与接受数据互谱矩阵误差都势必影响最佳波束形成器的输出信噪比性能。 4.1 最佳波束形成器稳健性影响因素 无论是MVDR还是MMSE,亦或是MSNR波束形成器,其加权向量其实统一可以写为 $$ {{w}{opt}}=\alpha R{x}^{-1}{{\bar{p}}_{s}} $$ 造成…

2019年10月16日 1条评论 2810点热度 5人点赞 davidcheung 阅读全文
语音处理学习笔记

《优化阵列信号处理》学习笔记(第三章)

第三章:规则阵波束设计     对于规则形状的基阵,它们的几何形状具有对称性,其阵列信号处理数学模型将表现出一些特有的性质。对于线阵来说,线阵空域信号处理与时间序列信号处理有很多相似之处,因此通过时空类比,很多时间序列分析的方法也可以应用于线阵空域信号处理。线阵具有轴对称性,其波束形成器同样具有轴对称性,所以线阵估计目标方向时具有左右舷模糊的缺点。 3.1 线阵 3.1.1 连续线阵 (1)频率-波数响应     由M个离散阵元组成的基阵的阵列流形向量为 3.1.2 均匀线列…

2019年10月10日 1条评论 1336点热度 0人点赞 davidcheung 阅读全文
12345…19
搜索
欢迎关注我的个人公众号
最新 热点 随机
最新 热点 随机
DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 奥地利匈牙利九日游旅程 论文阅读之Study of the General Kalman Filter for Echo Cancellation 小奥看房之鸿荣源珈誉府 杭州往返旅途及西溪喜来登和万怡的体验报告 2022年的第一篇碎碎念
奥地利匈牙利九日游旅程DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架
济南市生态环境局关于作出《济莱高铁项目前期工作筹备组新建济南至莱芜高速铁路项目环境影响报告书》审批决定的公告 《Python语言程序设计基础》课后习题程序整理(第2~4章) 由日本地震所想到的 计算机组成原理笔记第六章(6.1~6.2) 『超级决战!三英雄再会前传:Killer Qirhter』发布决定! Java语言程序设计【学堂在线】(第三章)整理
标签聚合
linux 学习 python学习 Java leetcode Python 生活 高中 鸟哥的linux私房菜 算法
最近评论
davidcheung 发布于 5 个月前(02月09日) The problem has been fixed. May I ask if you can s...
tk88 发布于 5 个月前(02月07日) Hmm is anyone else having problems with the pictur...
cuicui 发布于 8 个月前(10月20日) :wink:
niming 发布于 10 个月前(09月19日) 同级校友,能刷到太巧了
davidcheung 发布于 2 年前(08月16日) 我得找一下我之前整理的word文档看一下,如果找到了我就更新一下这篇文章。
Nolan 发布于 2 年前(07月25日) 您的笔记非常有帮助。贴图不显示了,可以更新一下吗?
davidcheung 发布于 3 年前(06月19日) 到没有看webrtc的代码。现在主要在看我们公司的代码了。。。只是偶尔看一看webrtc的东西。。。
aobai 发布于 3 年前(03月13日) gain_change_hangover_ 应该是每三个block 只能够调整一次,这样保证每帧...
匿名 发布于 5 年前(12月30日) 烫
小奥 发布于 5 年前(12月12日) webRTC里面的NS本身我记得就是在C++里面呀

COPYRIGHT © 2025 小奥的学习笔记. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

陕ICP备19003234号-1

鲁公网安备37120202000100号