除了写代码,我也喜欢记录所思所想,这里是我最近写的一些文章。
强化学习学习笔记,从MDP到动态规划,从MC方法到TD方法,从函数逼近到策略梯度,从DQN到PPO,从强化学习到大语言模型
分布式训练,包括训练的显存计算,分布式训练的基本概念、训练技术(DDP、FSDP、DeepSpeed)、分布式训练库(torchrun、Accelerate)
机器学习学习笔记,包括概率分布、朴素贝叶斯、信息熵、隐马尔可夫模型、FNN、BP算法、RNN、CNN、Transformer
LLaMA-Factory微调、推理等各阶段的参数说明
大语言模型微调,有关微调的定义、分类、方法、加速等方面的综述。
卸载小米系列机型的预装软件
Anaconda是一个开源的Python发行版和包管理器,用于简化Python环境的安装和管理,特别是在数据科学和机器学习领域中广泛使用。
我的博客搭建指南之一,主要介绍博客功能的演变升级历程,如控制台、导航栏、右键菜单等实现过程。
Pytest文档学习笔记,来自@华
世界是什么颜色的,你我又是什么颜色的。当我们相遇时,颜色是否能够相互交融晕染。
Windows下安装Linux子系统教程
华中科技大学计算机科学与技术学院编译笔记,包括文法与语言、词法分析、语法分析、语义分析、中间代码生成、代码优化、目标代码生成
自此,无人理解的诗歌拥有了读者。
华中科技大学计算机科学与技术学院操作系统原理课程笔记,包括绪论、操作系统的结构和硬件支持、进程管理
华中科技大学计算机科学与技术学院操作系统原理课程笔记,包括资源管理、处理机管理、主存管理
华中科技大学计算机科学与技术学院操作系统原理课程笔记,包括设备管理、文件管理
© 2025 息间