## 优化建议 ### 1. 添加Flash Attention支持 在 attention 计算中添加 Flash Attention 支持可显著提升性能。 ### 2. 添加混合精度训练优化 在训练配置中添加 bfloat16 支持可减少显存使用。 ### 3. 性能基准测试脚本 添加 benchmark.py 来测试不同硬件上的性能。 --- 由 upclose 提交
优化建议
1. 添加Flash Attention支持
在 attention 计算中添加 Flash Attention 支持可显著提升性能。
2. 添加混合精度训练优化
在训练配置中添加 bfloat16 支持可减少显存使用。
3. 性能基准测试脚本
添加 benchmark.py 来测试不同硬件上的性能。
由 upclose 提交