Nuestro proyecto está enfocado en crear material complementario para clases humanistas usando speech-to-text (voz a texto) y IA generativa.
El programa transcribe clases grabadas con la API de WhisperAI
, que deben ser previamente cortadas en audios formato .mp3
.
Estos audios se transcriben con Whisper y luego se procesan con la API de GPT3.5-Turbo
, para crear los siguientes elementos del PDF:
- Un titulo acorde al contenido de la clase
- Una transcripcion de la clase
- Una lista de palabras a revisar, que pueden estar mal transcritas o que se trate de nombres o conceptos pronunciados de forma erronea por el profesor
- Una serie de preguntas para el alumno, basado en el contenido visto en clases. Este material educativo se presenta en formato PDF.
Este proyecto está pensado para clases sobre tópicos como historia o filosofia, por formato mas de catédra de las clases, y no es adecuado para clases de materias como matemáticas o fÃsica.
- Ingresar credenciales de OpenAI y Whisper en los archivos
keys
ycredentials.yml
- Mover clase grabada, y renombrar el archivo a
input.mp3
(ya hay uninput.mp3
de prueba en el repositorio) - Instalar librerias necesarias
- Correr archivo
gogo.py
- Se generará un archivo
output.md
ymd-to-pdf.pdf
md-to-pdf
es el el producto final, con la transcripcion, las palabras a revisar, y las preguntas