源码编译Flash Attention

记录一次在A800上折腾Flash Attention源码编译的笔记。如果你也遇到了编译时间过长、内存溢出killed等问题,本文提供的关键环境变量设置和踩坑经验或许能帮你节省一些时间。

2025-07-26    2107 字    5 分钟

非Root用户安装新版本Cuda以及配置NLP环境

非root用户如何在无法修改已安装cuda驱动版本的情况下安装较新版本的transformers套件。

2024-03-10    2024-03-21    1424 字    3 分钟