我有一个问题,在预训练和知识注入,微调使用的什么类型,全参数还是lora,只冻结了LLM然后微调vision encoder 和 projection module; grpo阶段呢,是什么类型的训练呢,full 还是lora,冻结了vision encoder 和 projection module吗; 我在做另一个领域的垂类多模态大模型,参考一下您的项目感谢