Open
Description
Describe the bug
What the bug is, and how to reproduce, better with screenshots(描述bug以及复现过程,最好有截图)
使用agent最佳实践提供的脚本, 训练测试后, response中出现额外的<|endoftext|>和Human. 如果继续循环, 会破坏模型的应答模式.
Your hardware and system info
Write your system info like CUDA version/system/GPU/torch version here(在这里给出硬件信息和系统信息,如CUDA版本,系统,GPU型号和torch版本等)
此问题应该与硬件和系统无关.
Additional context
Add any other context about the problem here(在这里补充其他信息)