小奥的学习笔记

  • Home
  • Learning & Working
    • Speech Enhancement Notes
    • Programming language
    • Computer & DL
    • MOOC
  • Life
    • Life Time
    • Thinking & Comprehension
    • Volunteer
    • Plan
    • Travel
  • Footprints
  • GuestBook
  • About
    • About Me
    • 个人履历
    • 隐私策略
Thinking & Comprehension

2022年的第一篇碎碎念

距离我上一次写一些思考的内容以及过去1年零7个月了,时间也是真的有些长。在这接近两年的时间中,我由一名刚工作的新人成长了很多,也慢慢开始承担很多事情,所以很累,就很难静下心来去思考一些问题,或者有的时候思考了却难以有时间写下来。这次我感觉还是写一写也许比较好吧,给自己也是沉淀一下。 首先第一个我一直在思考的问题就是,我想保持一个多样性,diversity。从小我也是去过很多城市,自己思考过很多问题,但是随着年龄的增大,我也趋近于保守,特别是疫情以来,我感觉到中外在思想、文化、交流上由之前的不断交融走向对抗,而这一切…

2022年11月7日 0条评论 1467点热度 3人点赞 yszhang 阅读全文
语音处理学习笔记

卡尔曼滤波器学习笔记:初步认识

参考视频:https://space.bilibili.com/230105574/ 阅读原文请访问:https://qouwscohey.feishu.cn/docs/doccnAtfHvdvbQZzj5YfXWX8Etd 第一节:递归算法 不确定性:①不存在完美的数学模型;②系统的扰动不可控,也很难建模;③测量传感器存在误差。 我们可以发现,随着k增大,1/k趋近于0,那么xk->xk-1。也就是说,随着k增加,测量结果不再重要。而k越小,1/k越大,zk的作用越大。 如果我们把1/k用一个参数Kk来代替…

2021年11月13日 0条评论 2689点热度 1人点赞 yszhang 阅读全文
语音处理学习笔记

AEC个人学习串讲之AEC3:时延对齐、线性处理、非线性处理

计算参考信号和采集信号的时延:GetDelay() AEC3中的时延估计算法是使用计算滤波器能量最大块来作为延迟估计值,它是当滤波器收敛到一定程度时,计算所有滤波器系数的能量,取峰值的系数(tap)对应的delay就是对齐需要的delay。它是由步长为0.7的5个时域的NLMS滤波器组成,每个滤波器默认为32个块,每个块有16个样点,总计有32*16=512个样点,5个滤波器理论上共有512*5=2560个点,但实际上5个滤波器在时域上互相重叠8块(即输入的信号在时间上存在重叠),所以实际上5个滤波器可以估计256…

2021年10月17日 2条评论 6329点热度 9人点赞 yszhang 阅读全文
语音处理学习笔记

AEC个人学习串讲之AEC3:概述及非核心部分

整体框图 参考信号:送往时延估计、AEC的状态计算 采集信号:送往时延估计、线性滤波器、AEC的状态计算 线性滤波器使用时延对齐后的参考信号和采集信号进行处理;线性滤波器处理后的结果送往NLP模块,最终得到处理结果。 类调用关系图 EchoCanceller3(入口) AnalyzeRender 该部分只是将AudioBuffer类型的参考信号insert到render_transfer_queue_,这是一个swapqueue,数据从结尾insert,从开头remove,这里没有什么可以说的【当然insert之前…

2021年10月17日 0条评论 4133点热度 8人点赞 yszhang 阅读全文
语音处理学习笔记

AEC个人学习串讲之fullaec.m:非线性处理(下)

取消大小周了,周末有了更多的时间来自己学习。给自己立个flag,两周内把fullaec.m里面的线性滤波器、NLP等部分弄懂,发博客;再2~3周的时间看webrtc的AEC3的代码,同样发博客整理;然后再2~3周的时间看一下speex里面的AEC算法。 本次继续更新非线性处理部分。在学习过程中,参考了《实时语音处理实践指南》相关内容和网上有关博客的内容,在此对相关作者表示感谢。 非线性处理部分 计算完hnled,接下来开始计算ovrd。 hnlLocalMin是对hnlPrefAvgLow的最小值跟踪,其初始值为1…

2021年8月22日 1条评论 2574点热度 3人点赞 yszhang 阅读全文
语音处理学习笔记

AEC个人学习串讲之fullaec.m:非线性处理(上)

取消大小周了,周末有了更多的时间来自己学习。给自己立个flag,两周内把fullaec.m里面的线性滤波器、NLP等部分弄懂,发博客;再2~3周的时间看webrtc的AEC3的代码,同样发博客整理;然后再2~3周的时间看一下speex里面的AEC算法。 本次更新非线性处理部分。在学习过程中,参考了《实时语音处理实践指南》相关内容和网上有关博客的内容,在此对相关作者表示感谢。 非线性处理 非线性处理的主要思想: WebRTC是利用信号之间的频域相干性c(0<=c<=1)来衡量误差信号中残留回声的大小的。首…

2021年8月15日 2条评论 3135点热度 4人点赞 yszhang 阅读全文
Life Time

AEC个人学习串讲之fullaec.m:线性处理部分

取消大小周了,周末有了更多的时间来自己学习。给自己立个flag,两周内把fullaec.m里面的线性滤波器、NLP等部分弄懂,发博客;再2~3周的时间看webrtc的AEC3的代码,同样发博客整理;然后再2~3周的时间看一下speex里面的AEC算法。然后再2~3周吃一吃公司的算法,但是这个整理只是自己学习用,不会做任何公开发布。 所以下面开始第一个flag的内容。这周只有空看完了线性部分,仿佛没有看到这里面有DTD的部分,所以先发一下线性部分,后面整理一下非线性部分。在学习过程中,参考了《实时语音处理实践指南》相…

2021年8月8日 1条评论 2272点热度 0人点赞 yszhang 阅读全文
12345…114
搜索
欢迎关注我的个人公众号
最新 热点 随机
最新 热点 随机
【论文精读】Zipformer:如何重新定义语音识别编码器的效率与性能? WeNet: Production Oriented Streaming and Non-streaming End-to-End Speech Recognition Toolkit DEEPFILTERNET:一种基于深度滤波的全频带音频低复杂度语音增强框架 奥地利匈牙利九日游旅程 论文阅读之Study of the General Kalman Filter for Echo Cancellation 小奥看房之鸿荣源珈誉府
WeNet: Production Oriented Streaming and Non-streaming End-to-End Speech Recognition Toolkit【论文精读】Zipformer:如何重新定义语音识别编码器的效率与性能?
小花豆生活第4天:美国大兵&“谢谢” An English eBooks download website 字节跳动互娱提前批面试笔记和反思记录 Python chapter 7 learning notes 《鸟哥的Linux私房菜》(基础篇)笔记整理(第6章)Part.2 删除com1、aux等文件夹的方法
标签聚合
Python 高中 鸟哥的linux私房菜 linux Java 学习 算法 leetcode 生活 python学习
最近评论
davidcheung 发布于 1 年前(02月09日) The problem has been fixed. May I ask if you can s...
tk88 发布于 1 年前(02月07日) Hmm is anyone else having problems with the pictur...
cuicui 发布于 1 年前(10月20日) :wink:
niming 发布于 1 年前(09月19日) 同级校友,能刷到太巧了
davidcheung 发布于 3 年前(08月16日) 我得找一下我之前整理的word文档看一下,如果找到了我就更新一下这篇文章。
Nolan 发布于 3 年前(07月25日) 您的笔记非常有帮助。贴图不显示了,可以更新一下吗?
davidcheung 发布于 4 年前(06月19日) 到没有看webrtc的代码。现在主要在看我们公司的代码了。。。只是偶尔看一看webrtc的东西。。。
aobai 发布于 4 年前(03月13日) gain_change_hangover_ 应该是每三个block 只能够调整一次,这样保证每帧...
匿名 发布于 5 年前(12月30日) 烫
小奥 发布于 5 年前(12月12日) webRTC里面的NS本身我记得就是在C++里面呀

COPYRIGHT © 2025 小奥的学习笔记. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang

陕ICP备19003234号-1

鲁公网安备37120202000100号