Yihua's Blog

Work hard and keep simple.

《Bauklötze》音乐解构

积木崩塌时的命运回响,泽野弘之用音符砌筑的巨人悲歌

《Bauklötze》音乐解构 - 积木崩塌时的命运回响,泽野弘之用音符砌筑的巨人悲歌 想为《进击的巨人》的 OST 写音乐鉴赏,已经是我心里惦记很久的事了。一方面,泽野弘之的配乐确实令人动容;另一方面,《进击的巨人》这部作品与泽野的音乐在情感与氛围的结合上堪称 1+1 > 2,每当音符响起,观众的心弦也随之颤动。于是,我在这里开个新坑,把自己最喜欢的一系列配乐做成音乐鉴赏,算是我读...

DualPipe Explained: A Comprehensive Guide to DualPipe That Anyone Can Understand—Even Without a Distributed Background [En/中]

DualPipe 深入浅出:没有分布式训练基础也能看懂的 DualPipe 全方位讲解


Navigating the RLHF Landscape: From Policy Gradients to PPO, GAE, and DPO for LLM Alignment [En/中]

大语言模型 RLHF 全链路揭秘:从策略梯度、PPO、GAE 到 DPO 的实战指南


DeepSeek-R1 Dissection: Understanding PPO & GRPO Without Any Prior Reinforcement Learning Knowledge [En/中]

DeepSeek-R1 技术剖析:没有强化学习基础也能看懂的 PPO & GRPO


Why Cache 32 Heads When One Latent Variable Suffices? A Theory-to-Code Guide to DeepSeek’s MLA for KV-Cache [En/中]

从多头共享到潜变量:DeepSeek的MLA在低秩投影与按需解压中重新定义 KV-Cache


From Zero to Reasoning Hero: How DeepSeek-R1 Leverages Reinforcement Learning to Master Complex Reasoning [En/中]

千呼万唤始出来:DeepSeek-R1 如何通过强化学习实现复杂推理


A Review on the Evolvement of Load Balancing Strategy in MoE LLMs: Pitfalls and Lessons [En/中]

关于 MoE 大模型负载均衡策略演进的回顾:坑点与经验教训


Patching the Foundation Models: Pitfalls and Pains in Machine Unlearning [En/中]

给大模型打打补丁:机器反学习方法中的陷阱与痛点


读书笔记——重述《Effective C++》[中/En]

Reading Notes - Talk about Effective C++ in My Own Words


漫谈C++——C++17中的constexpr

C++学习笔记

C++17中的constexpr 在一段时间以前,我曾经写过编译期常量和constexpr,那么在这篇文章的上半部分,我们的目光会放在C++17中和constepxr有关的新特性;在文章的后半部分,我们将综合这四篇文章所涉及到的知识点,在编译期解决FizzBuzz问题,我会着重于介绍我在处理编译期问题的过程和思路,而不是简单的把示例代码罗列出来。如果你对编译期常量和constexpr还一无所...