更新链接收集

SapphireLab · SapphireLab · commit a347e1db1e0b · 2025-03-01T03:52:16.000+08:00
diff --git a/Links.md b/Links.md
@@ -109,51 +109,138 @@
 - 2024.07.07 [Extrinsic Hallucinations in LLMs](https://lilianweng.github.io/posts/2024-07-07-hallucination/)
 - 2024.11.28 [Reward Hacking in Reinforcement Learning](https://lilianweng.github.io/posts/2024-11-28-reward-hacking/)
 
-## 知乎
+## Bilibili
 
-- Fred
-  - [专栏: 语音生成算法](https://www.zhihu.com/column/c_1741531927322664961)
-  - 2024-05-14 GPT-SoVITS 源码梳理系列 (6 篇)
-- 倦鸟余花
-  - 2024.07.02 [文章: 举世无双语音合成 VITS 发展历程](https://zhuanlan.zhihu.com/p/474601997)
-- 林唯秀
-  - 2023.12.30 [文章: 万字长文+详细公式推导解读扩散模型的经典论文](https://zhuanlan.zhihu.com/p/674019932)
-    - 最近更新: 2024.06.21
-  - 2024.01.15 [文章: 论文解读：扩散模型也能做语音合成吗？](https://zhuanlan.zhihu.com/p/672986204)
-    - 最近更新: 2024.01.15
-  - 2024.05.22 [文章: 别慌! 一文教你看懂 GPT-4o 背后的语音技术](https://zhuanlan.zhihu.com/p/698725358)
-    - 最近更新: 2024.05.27
-    - 二次整理: [文件](Blogs/2024.05.27_一文教你看懂GPT-4o背后的语音技术-林唯秀.md) #TODO 修改排版
-- 笑叔神侠
-  - 2025.02.10 [文章: 深入解析 Flow Matching 技术](https://zhuanlan.zhihu.com/p/685921518)
-- 小冬瓜AIGC
-  - [专栏: 手撕 LLM](https://www.zhihu.com/column/c_1683257985659564032)
-- v_JULY_v 七月
-  - 2020.01.05 [16 系列合集](https://blog.csdn.net/v_JULY_v/article/details/6543438)
-    - 最近更新: 2025.02.21
-    - 01 微软面试 100 题
-    - 02 十五个经典算法
-    - 03 程序员编程艺术 40 章
-    - 04 红黑树/B树/R树/Trie树
-    - 05 机器学习十大算法
-    - 06 大模型与 ChatGPT 系列
-    - 07 Transformer 改进
-    - 08 DeepSeek
-    - 09 AIGC 与 CV 多模态
-    - 10 工业协作机器人
-    - 11 机器人大模型
-    - 12 视觉语言动作机器人
-    - 13 具身智能
-    - 14 七月论文审稿 GPT
-    - 15 RAG 知识库问答
-    - 16 智能体 Agent 项目
-    - 17 其他文章节选
-  - 2023.04.12 [文章: 从零实现Transformer的简易版与强大版：从300多行到3000多行](https://blog.csdn.net/v_JULY_v/article/details/130090649)
-    - 最近更新: 2023.11.24
+- [bugyu_ld 于泓 (鲁东大学)](https://space.bilibili.com/330866298)
+  - [智能语音处理合集](https://space.bilibili.com/330866298/lists/651756?type=season)
+    - 最近更新: 2024.12.07
+    - 未分类
+      - 2023.03.19 语音信号的读取与显示
+      - 2023.03.19 语音特征提取与预提取
+      - 2021.03.03 DTW（动态时间规整）算法原理与应用
+      - 2021.06.30 基于 GMM-HMM 的孤立词识别-1
+      - 2021.06.30 基于 GMM-HMM 的孤立词识别-2
+      - 2021.06.13 基于 LSTM 的唤醒词检测
+      - 2023.05.17 基于 DTW 算法的命令字识别-streamlit实现
+      - 2023.07.15 DTW 关键字检测-代码实现
+      - 2023.04.03 音乐检索-Shazam算法原理
+      - 2023.04.04 音乐检索-Shazam代码实现
+      - 2023.04.14 谁都能开口说-wav2lip演示视频
+      - 2023.04.14 wav2lip原理与代码实现
+      - 2021.05.29 Python与人工智能-隐马尔科夫模型 (HMM)-1
+      - 2021.06.06 Python与人工智能-HMM-2-维特比Viterbi译码
+      - 2021.06.06 Python与人工智能-HMM-3-模型训练 鲍姆-韦尔奇算法（Baum-Welch）
+      - 2021.06.27 Python与人工智能-HMM-5-hmmlearn的应用
+    - 语音增强
+      - 2021.07.11 语音增强 谱减法 01 02
+      - 2021.07.15 语音增强 维纳滤波 01 02
+      - 2021.07.19 语音增强 最小均方误差估计 01 02
+      - 2021.07.28 语音增强 子空间法 01 02
+      - 2021.08.07 语音增强 DNN 频谱映射
+      - 2021.08.07 语音增强 基于 DNN 的 IRM 学习方法
+      - 2021.08.12 语音增强 SEGAN 原理解释 + PyTorch 实现
+      - 2024.04.10 语音增强 FRCRN 模型介绍与推理实现
+      - 2024.04.13 语音增强 FRCRN 模型整体结构与 STFT 实现
+      - 2024.04.13 语音增强 FRCRN U-Net 内部结构
+      - 2024.04.13 语音增强 FRCRN 损失函数 SI-SNR 与训练
+    - 回声消除
+      - 2022.08.21 回声消除 LMS 原理
+      - 2022.08.21 回声消除 LMS 代码实现
+      - 2022.08.28 回声消除 BLMS
+      - 2022.08.28 回声消除 NLMS
+      - 2022.08.28 回声消除 BNLMS
+      - 2022.08.31 回声消除 RLS (递归最小二乘)
+      - 2022.09.01 回声消除 卡尔曼滤波
+      - 2022.09.08 回声消除 FDAF 频域动态滤波
+      - 2022.09.09 回声消除 PFDAF (分块频域自适应滤波)
+      - 2023.05.20 回声消除 效果演示
+      - 2024.04.21 回声消除 wRLS + 神经网络 AEC
+      - 2024.04.21 回声消除 wRLS + 神经网络 AEC 延时估计 TDE 部分
+      - 2024.04.24 回声消除 FSMN 神经网络部分介绍
+      - 2024.04.24 回声消除 wRLS 实现细节
+    - 声音转换
+      - 2021.03.06 语音合成 基于 WSOLA 的语音变调 (变声器)
+      - 2021.03.11 基于GMM的声音转换-1转换模型解析
+      - 2021.03.13 基于GMM的声音转换-2具体代码及实现流程
+      - 2021.08.21 非并行声音转换-CycleGan-VC2-1 2
+      - 2021.09.04 基于StarGan的多对多声音转换-1-原理解释
+      - 2021.09.04 基于StarGan的多对多声音转换-2-代码实现
+      - 2024.12.07 Seed-VC 原理与推理代码解析
+    - 乐音合成
+      - 2021.09.10 基于WaveNet的乐音生成-1-基本原理
+      - 2021.09.11 基于WaveNet的乐音生成-1-网络结构
+      - 2021.09.10 基于WaveNet的乐音生成-2-代码实现
+      - 2023.10.27 So-VITS-SVC-1-整体框架
+      - 2023.11.01 So-VITS-SVC-2-数据准备和预处理
+      - 2023.11.02 So-VITS-SVC-3-先验后验编码器
+      - 2023.11.06 So-VITS-SVC-4-decoder部分
+      - 2023.11.08 So-VITS-SVC-5-蛇形激活函数
+      - 2023.11.15 So-VITS-SVC-6-Flow部分
+      - 2023.11.16 So-VITS-SVC-7-训练及损失函数部分
+      - 2023.11.22 So-VITS-SVC-8-训练推理以及基频矫正
+    - 语音合成
+      - 2021.09.19 基于Tacotron2的语音合成-1-网络结构
+      - 2021.09.19 基于Tacotron2的语音合成-2-代码实现
+      - 2023.01.08 SV2TTS-5秒语音克隆
+      - 2023.01.08 SV2TTS-语音克隆（中文版）
+      - 2023.07.26 VITS-1 一个应用实例
+      - 2023.07.30 VITS-2 三种生成模型
+      - 2023.08.16 VITS-3 模型整体结构
+      - 2023.08.16 VITS-4 config 文件解释
+      - 2023.08.18 VITS-5 文本编码器
+      - 2023.08.18 VITS-5-2 文本编码器部分代码讲解
+      - 2023.08.22 VITS-6 相对位置编码 Relative Position Representations
+      - 2023.08.30 VITS-7 后验音频后验编码器
+      - 2023.08.30 VITS-8 Flow 部分的实现
+      - 2023.08.31 VITS-9 音频解码器部分
+      - 2023.09.04 VITS-10 随机时长预测1
+      - 2023.09.04 VITS-11 随机时长预测2
+      - 2023.09.05 VITS-12 随机时长预测3-convFlow
+      - 2023.09.07 VITS-13 鉴别器部分
+      - 2023.09.08 VITS-14 生成器总体工作流程
+      - 2023.09.08 VITS-15 训练过程及损失函数计算
+      - 2023.09.13 VITS-16 数据准备+训练自己的模型
+      - 2023.09.22 VITS-17 快速微调(fast finetuning)
+      - 2023.09.25 VITS-18 声音转换(voice conversion)
+    - 语音识别
+      - 2024.03.05 Whisper的基本使用
+      - 2024.03.07 Faster Whisper 基本使用
+    - 声纹识别
+      - 2022.09.28 声纹识别-GMM-UBM算法原理
+      - 2022.09.28 声纹识别-GMM-UBM-数据准备
+      - 2022.09.28 声纹识别-GMM-UBM-代码实现
 
-## 魔搭社区
+- [Double童发发](https://space.bilibili.com/323109608)
+  - 2024.07.16 [系列: Rectified Flow 基本原理](https://space.bilibili.com/323109608/lists/3427751?type=season) 4P
+  - 2024.07.31 [系列: 从零手搓 Flow Matching](https://space.bilibili.com/323109608/lists/3732092?type=season)
+  - 2024.08.05 [合集: 零门槛掌握 DDPM](https://space.bilibili.com/323109608/lists/3466926?type=season) 4P
+  - 2024.09.06 [系列: 一致性模型&连续一致性模型](https://space.bilibili.com/323109608/lists/4329394?type=season)
+  - 2024.09.26 [系列: 扩散模型通用框架 EDM](https://space.bilibili.com/323109608/lists/3828551?type=season)
 
-- 2024.08.12 [Qwen2-Audio开源，让VoiceChat更流畅！](https://www.modelscope.cn/headlines/article/602)
+- [RethinkFun](https://space.bilibili.com/18235884)
+  - 2024.06.30 理解大模型分布式训练技术
+  - 2024.07.02 评价大模型好坏的指标
+  - 2024.07.09 用梯度检查点节省内存
+  - 2024.07.16 十分钟学懂vLLM内部原理
+  - 2024.07.23 FlashAttention原理讲解
+  - 2024.08.08 大模型预训练
+  - 2024.08.23 大模型微调SFT_NEFTune
+  - 2024.09.29 大模型强化学习PPO代码实现
+  - 2024.12.14 [一次学懂多模态大模型系列教程](https://www.bilibili.com/video/BV15RDtYqE4r/) 9P
+
+- [数字黑魔法](https://space.bilibili.com/1235535223)
+  - 2023.10.13 [系列·九天玩转 LangChain](https://space.bilibili.com/1235535223/lists/1794575?type=season)
+  - 2024.06.19 [系列·Diffuers 实战教程](https://space.bilibili.com/1235535223/lists/3392067?type=season)
+    - 2024.06.19 [01: Hello World](https://www.bilibili.com/video/BV1s1421r7Zg/)
+    - 2024.07.11 [02: Scheduler 和 Model](https://www.bilibili.com/video/BV1YE421A7Jq/)
+    - 2024.07.15 [03: U-Net](https://www.bilibili.com/video/BV1NS421d785/)
+    - 2024.08.21 [04: Fine-Tuning 与 Guidance](https://www.bilibili.com/video/BV1XuWae8ELs/)
+    - 2024.09.11 [05: Condition](https://www.bilibili.com/video/BV1jE4BebEcH/)
+    - 2024.10.02 [06: 真实的 Stable Diffusion](https://www.bilibili.com/video/BV1RU4ueLEXH/)
+
+- [有趣的理工男](https://space.bilibili.com/2008799191)
+  - 2023.01.29 [合集·傅里叶变换从零到一](https://space.bilibili.com/2008799191/channel/collectiondetail?sid=990857)
+  - 2023.12.18 [合集·小波变换](https://space.bilibili.com/2008799191/lists/4325308?type=season)
 
 ## CSDN
 
@@ -168,7 +255,7 @@
   - 2024.03.07 [VITS 模型详解与公式推导：基于条件变分自编码器和对抗学习的端到端语音合成模型](https://blog.csdn.net/m0_56942491/article/details/136536601)
     - 最近更新: 2024.05.11
 - 韩曙亮
-  - [系列·音频编解码原理 (已合并整理)](Blogs/音频编解码原理-韩曙亮.md)
+  - [系列·音频编解码原理 (已合并整理)](Blogs/2024.01.24_音频编解码原理_韩曙亮.md)
     - 2024.01.24 [01: 声音特性|声音本质|声音频率|声音频率和响度本质分析|数字音频|脉冲编码调制PCM|采样振幅值|奈奎斯特 Nyguist 采样定理](https://hanshuliang.blog.csdn.net/article/details/135781972)
     - 2024.01.25 [02: 采样值-本质分析|采样值-震动振幅值|采样值的录制与播放|采样值在播放设备中才有意义|音频采样率|音频采样精度|音频通道数](https://hanshuliang.blog.csdn.net/article/details/135822403)
     - 2024.01.27 [03: 比特率/码率|帧/帧长|帧采样排列方式-交错模式/非交错模式](https://hanshuliang.blog.csdn.net/article/details/135852745)
@@ -181,6 +268,9 @@
 
 - [Audio Course](https://hf-mirror.com/learn/audio-course/)
   - 译: [音频特征](https://datawhalechina.github.io/hugging-audio/) by Datawhale
+- Diffusers
+- PEFT
+- Transformers
 
 ## Github
 
@@ -192,6 +282,13 @@
 - [Repo·speechmetrics](https://github.com/aliutkus/speechmetrics)
   - 最近更新: 2023.07.05
 
+## 魔搭社区 ModelScope
+
+- 2024.08.12 [Qwen2-Audio开源，让VoiceChat更流畅！](https://www.modelscope.cn/headlines/article/602)
+
+## Stanford
+
+- CS224S Spring 2024: [Spoken Language Processing](https://web.stanford.edu/class/cs224s/)
 
 ## Tencent Cloud
 
@@ -204,4 +301,66 @@
 
 - Hung-yi Lee/李宏毅
   - [2024 生成式AI导论](https://www.youtube.com/playlist?list=PLJV_el3uVTsPz6CTopeRp2L2t4aL_KgiI)
-  - [Diffusion Model](https://www.youtube.com/playlist?list=PLJV_el3uVTsNi7PgekEUFsyVllAJXRsP-)
+    - 课程页: https://speech.ee.ntu.edu.tw/~hylee/genai/2024-spring.php
+    - [00 课程说明](https://www.youtube.com/watch?v=AVIKFXLCPY8)
+    - 01 生成式AI是什么
+    - 02 今日的生成式AI厉害在哪里
+    - 03 训练不了AI可以训练你自己_上
+    - 04 训练不了AI可以训练你自己_中
+    - 05 训练不了AI可以训练你自己_下
+    - 06 大型语言模型修炼史_上_自我学习
+    - 07 大型语言模型修炼史_中_名师指点
+    - 08 大型语言模型修炼史_下_参与实战
+    - 09 以大型语言模型打造的AI智能体
+    - 10 浅谈Transformer
+    - 11 浅谈大型语言模型的可解释性
+    - 12 浅谈检定大型语言模型能力的各种方式
+    - 13 浅谈大型语言模型相关的安全性议题_上
+    - 14 浅谈大型语言模型相关的安全性议题_下
+    - 15 浅谈生成式AI的生成策略
+    - 16 可以加速所有语言模型生成速度的技术
+  - [Diffusion Model](https://www.youtube.com/playlist?list=PLJV_el3uVTsNi7PgekEUFsyVllAJXRsP-)
+  - 2023.05.17 Speech Foundation Models 语音基石模型 - 张凯为
+  - 2024.05.20 [GPT-4o 背后可能的语音技术猜测](https://www.youtube.com/watch?v=CgQ3lUOpXgc)
+
+## 知乎 Zhihu
+
+- Fred
+  - [专栏: 语音生成算法](https://www.zhihu.com/column/c_1741531927322664961)
+  - 2024-05-14 GPT-SoVITS 源码梳理系列 (6 篇)
+- 倦鸟余花
+  - 2024.07.02 [文章: 举世无双语音合成 VITS 发展历程](https://zhuanlan.zhihu.com/p/474601997)
+- 林唯秀
+  - 2023.12.30 [文章: 万字长文+详细公式推导解读扩散模型的经典论文](https://zhuanlan.zhihu.com/p/674019932)
+    - 最近更新: 2024.06.21
+  - 2024.01.15 [文章: 论文解读：扩散模型也能做语音合成吗？](https://zhuanlan.zhihu.com/p/672986204)
+    - 最近更新: 2024.01.15
+  - 2024.05.22 [文章: 别慌! 一文教你看懂 GPT-4o 背后的语音技术](https://zhuanlan.zhihu.com/p/698725358)
+    - 最近更新: 2024.05.27
+    - 二次整理: [文件](Blogs/2024.05.27_一文教你看懂GPT-4o背后的语音技术_林唯秀.md) #TODO 修改排版
+- 笑叔神侠
+  - 2025.02.10 [文章: 深入解析 Flow Matching 技术](https://zhuanlan.zhihu.com/p/685921518)
+- 小冬瓜AIGC
+  - [专栏: 手撕 LLM](https://www.zhihu.com/column/c_1683257985659564032)
+- v_JULY_v 七月
+  - 2020.01.05 [16 系列合集](https://blog.csdn.net/v_JULY_v/article/details/6543438)
+    - 最近更新: 2025.02.21
+    - 01 微软面试 100 题
+    - 02 十五个经典算法
+    - 03 程序员编程艺术 40 章
+    - 04 红黑树/B树/R树/Trie树
+    - 05 机器学习十大算法
+    - 06 大模型与 ChatGPT 系列
+    - 07 Transformer 改进
+    - 08 DeepSeek
+    - 09 AIGC 与 CV 多模态
+    - 10 工业协作机器人
+    - 11 机器人大模型
+    - 12 视觉语言动作机器人
+    - 13 具身智能
+    - 14 七月论文审稿 GPT
+    - 15 RAG 知识库问答
+    - 16 智能体 Agent 项目
+    - 17 其他文章节选
+  - 2023.04.12 [文章: 从零实现Transformer的简易版与强大版：从300多行到3000多行](https://blog.csdn.net/v_JULY_v/article/details/130090649)
+    - 最近更新: 2023.11.24