我的文章

除了写代码,我也喜欢记录所思所想,这里是我最近写的一些文章。

强化学习笔记(四)

强化学习学习笔记,从MDP到动态规划,从MC方法到TD方法,从函数逼近到策略梯度,从DQN到PPO,从强化学习到大语言模型

Posted on 2025/1/16

强化学习笔记(三)

强化学习学习笔记,从MDP到动态规划,从MC方法到TD方法,从函数逼近到策略梯度,从DQN到PPO,从强化学习到大语言模型

Posted on 2025/1/16

强化学习笔记(二)

强化学习学习笔记,从MDP到动态规划,从MC方法到TD方法,从函数逼近到策略梯度,从DQN到PPO,从强化学习到大语言模型

Posted on 2025/1/16

强化学习笔记(一)

强化学习学习笔记,从MDP到动态规划,从MC方法到TD方法,从函数逼近到策略梯度,从DQN到PPO,从强化学习到大语言模型

Posted on 2025/1/16

分布式训练

分布式训练,包括训练的显存计算,分布式训练的基本概念、训练技术(DDP、FSDP、DeepSpeed)、分布式训练库(torchrun、Accelerate)

Posted on 2025/1/5

机器学习笔记

机器学习学习笔记,包括概率分布、朴素贝叶斯、信息熵、隐马尔可夫模型、FNN、BP算法、RNN、CNN、Transformer

Posted on 2025/1/4

LLaMA-Factory参数说明

LLaMA-Factory微调、推理等各阶段的参数说明

Posted on 2024/11/22

大模型微调BUG记录

大语言模型微调,有关微调的定义、分类、方法、加速等方面的综述。

Posted on 2024/11/19

大语言模型微调综述

大语言模型微调,有关微调的定义、分类、方法、加速等方面的综述。

Posted on 2024/11/19

卸载小米系列机型的预装软件

卸载小米系列机型的预装软件

Posted on 2024/5/4

Anaconda安装教程及命令

Anaconda是一个开源的Python发行版和包管理器,用于简化Python环境的安装和管理,特别是在数据科学和机器学习领域中广泛使用。

Posted on 2024/3/7

博客搭建指南(一)

我的博客搭建指南之一,主要介绍博客功能的演变升级历程,如控制台、导航栏、右键菜单等实现过程。

Posted on 2024/2/1

Pytest文档学习笔记

Pytest文档学习笔记,来自@华

Posted on 2023/11/30

Colorful Season

世界是什么颜色的,你我又是什么颜色的。当我们相遇时,颜色是否能够相互交融晕染。

Posted on 2023/11/20

Windows下安装WSL 2

Windows下安装Linux子系统教程

Posted on 2023/9/11

编译原理笔记

华中科技大学计算机科学与技术学院编译笔记,包括文法与语言、词法分析、语法分析、语义分析、中间代码生成、代码优化、目标代码生成

Posted on 2023/7/24

凸凹

自此,无人理解的诗歌拥有了读者。

Posted on 2023/7/17

操作系统原理笔记(一)

华中科技大学计算机科学与技术学院操作系统原理课程笔记,包括绪论、操作系统的结构和硬件支持、进程管理

Posted on 2023/3/12

操作系统原理笔记(二)

华中科技大学计算机科学与技术学院操作系统原理课程笔记,包括资源管理、处理机管理、主存管理

Posted on 2023/3/12

操作系统原理笔记(三)

华中科技大学计算机科学与技术学院操作系统原理课程笔记,包括设备管理、文件管理

Posted on 2023/3/12
Breathspace

© 2025 息间

Instagram GitHub