我的文章

除了写代码,我也喜欢记录所思所想,这里是我最近写的一些文章。

强化学习笔记(四)

强化学习学习笔记,从MDP到动态规划,从MC方法到TD方法,从函数逼近到策略梯度,从DQN到PPO,从强化学习到大语言模型

发布于 2025/01/16 00:00

强化学习笔记(三)

强化学习学习笔记,从MDP到动态规划,从MC方法到TD方法,从函数逼近到策略梯度,从DQN到PPO,从强化学习到大语言模型

发布于 2025/01/16 00:00

强化学习笔记(二)

强化学习学习笔记,从MDP到动态规划,从MC方法到TD方法,从函数逼近到策略梯度,从DQN到PPO,从强化学习到大语言模型

发布于 2025/01/16 00:00

强化学习笔记(一)

强化学习学习笔记,从MDP到动态规划,从MC方法到TD方法,从函数逼近到策略梯度,从DQN到PPO,从强化学习到大语言模型

发布于 2025/01/16 00:00

分布式训练

分布式训练,包括训练的显存计算,分布式训练的基本概念、训练技术(DDP、FSDP、DeepSpeed)、分布式训练库(torchrun、Accelerate)

发布于 2025/01/05 00:00

机器学习笔记

机器学习学习笔记,包括概率分布、朴素贝叶斯、信息熵、隐马尔可夫模型、FNN、BP算法、RNN、CNN、Transformer

发布于 2025/01/04 00:00

LLaMA-Factory参数说明

LLaMA-Factory微调、推理等各阶段的参数说明

发布于 2024/11/22 00:00

大模型微调BUG记录

大语言模型微调,有关微调的定义、分类、方法、加速等方面的综述。

发布于 2024/11/19 00:00

大语言模型微调综述

大语言模型微调,有关微调的定义、分类、方法、加速等方面的综述。

发布于 2024/11/19 00:00

卸载小米系列机型的预装软件

卸载小米系列机型的预装软件

发布于 2024/05/04 00:00

Anaconda安装教程及命令

Anaconda是一个开源的Python发行版和包管理器,用于简化Python环境的安装和管理,特别是在数据科学和机器学习领域中广泛使用。

发布于 2024/03/07 00:00

博客搭建指南(一)

我的博客搭建指南之一,主要介绍博客功能的演变升级历程,如控制台、导航栏、右键菜单等实现过程。

发布于 2024/02/01 00:00

Pytest文档学习笔记

Pytest文档学习笔记,来自@华

发布于 2023/11/30 00:00

Colorful Season

世界是什么颜色的,你我又是什么颜色的。当我们相遇时,颜色是否能够相互交融晕染。

发布于 2023/11/20 00:00

Windows下安装WSL 2

Windows下安装Linux子系统教程

发布于 2023/09/11 00:00

编译原理笔记

华中科技大学计算机科学与技术学院编译笔记,包括文法与语言、词法分析、语法分析、语义分析、中间代码生成、代码优化、目标代码生成

发布于 2023/07/24 00:00

凸凹

自此,无人理解的诗歌拥有了读者。

发布于 2023/07/17 00:00

操作系统原理笔记(一)

华中科技大学计算机科学与技术学院操作系统原理课程笔记,包括绪论、操作系统的结构和硬件支持、进程管理

发布于 2023/03/12 00:00

操作系统原理笔记(二)

华中科技大学计算机科学与技术学院操作系统原理课程笔记,包括资源管理、处理机管理、主存管理

发布于 2023/03/12 00:00

操作系统原理笔记(三)

华中科技大学计算机科学与技术学院操作系统原理课程笔记,包括设备管理、文件管理

发布于 2023/03/12 00:00
Breathspace

© 2025 息间

Instagram GitHub