Nesse projeto da matéria de Reinforcement Learning, nos propomos a desenvolver uma ferramenta que se sustenta no uso de LLMs e a técnica de treinamento de multi-agentes cooperativos para fazer generação de código.
- Arquivo para adicionar prompts para coder e reviewer: main_notebook.ipynb
- Arquivo para conectar com o LLM, e definir a função de avaliação: llm.py
- Arquivo para alterar a função de recompensa do reviewer: utils.py
- Link da apresentação: https://bit.ly/slidesRL