Martinez, Nicolas Agustin
El módulo VModel proporciona una clase diseñada para trabajar con embeddings de texto y buscar coincidencias en una base de datos de tags. Utiliza la biblioteca transformers
para obtener embeddings de texto y la biblioteca datasets
para gestionar y buscar en el conjunto de datos de tags.
- Inicialización y carga de un modelo preentrenado y su tokenizador.
- Carga de datos de tags desde un archivo JSON.
- Vectorización de la base de datos de tags y creación de un índice FAISS para búsquedas rápidas.
- Obtención de embeddings para una lista de textos.
- Búsqueda de las mejores coincidencias para un texto de entrada en el conjunto de datos de tags.
- (No implementado) Búsqueda de tags por ID.
- Asegúrese de tener todas las dependencias instaladas. Estas incluyen
torch
,transformers
ydatasets
. - Inicialice una instancia de la clase VModel con la ruta al archivo JSON que contiene los tags.
- Utilice el método
get_simils(sentence)
para obtener tags similares para una oración dada. - (Opcional) Si necesita buscar tags por ID, utilice el método
get_by_ID(id)
.
vm = VModel(tags_path="ruta/a/tags.json")
resultados = vm.get_simils("Ejemplo de oración")
print(resultados)
Notas:
- El método get_by_ID(id) aún no está implementado.
- Asegúrese de tener el archivo tags.json en la ruta especificada o proporcione la ruta correcta al inicializar la clase VModel.
Este es un servicio API REST desarrollado en Flask. Si estás utilizando Windows, es necesario instalar waitress para servir la aplicación. Puedes hacerlo con el comando pip install waitress
y luego ejecutar la aplicación con waitress-serve --port=3000 app:app
.
- Flask
- flask_cors
- waitress (solo para Windows)
- vector_model (módulo personalizado)
Se carga el archivo tags.json a través del modelo VModel y se inicializa la aplicación Flask.
Descripción: Devuelve similitudes basadas en el texto proporcionado.
Entrada: JSON con el campo text.
Salida: JSON con las similitudes encontradas.
Errores: Si ocurre un error durante la ejecución, se imprime el error y se devuelve un objeto JSON vacío.