Memvid Document Encoder

Un'interfaccia web semplice per codificare documenti PDF e file di testo in formato Memvid.

Cos'è Memvid?

Memvid è una libreria Python per la creazione di knowledge base basate su video QR code che permette:

Suddividere e codificare dati testuali in video di codici QR
Ricerca semantica veloce e recupero dai video QR
Interfaccia conversazionale AI con memoria contestuale

Come usare questa app

Avvia l'app con python run.py
Carica un file PDF o un file di testo/markdown
Regola i parametri avanzati (opzionale)
Premi il pulsante "Codifica Documento"
Scarica il file video MP4 e il file indice JSON generati

Parametri avanzati

Dimensione Chunk: Quanti caratteri includere in ogni frammento di testo (chunk)
Sovrapposizione: Quanti caratteri sovrapporre tra chunk consecutivi
FPS: Frame per secondo nel video generato (influenza la densità di dati)
Dimensione Frame: Dimensione dei frame del codice QR (in pixel)

Struttura dei file

uploads/: Cartella per i file caricati
outputs/: Cartella per i file generati
debug.py: Script per verificare l'ambiente
check_api.py: Script per verificare l'API di Memvid
esempio_base.py: Esempio di utilizzo senza interfaccia
simple_app.py: Versione semplificata dell'interfaccia web

API di Memvid

Da notare che l'API di Memvid ha alcune particolarità:

# Inizializzazione
encoder = MemvidEncoder()  # Non accetta chunk_size/overlap nel costruttore

# Aggiunta di documenti PDF
encoder.add_pdf(file_path, chunk_size=500, overlap=50)  # Parametri di chunking qui

# Aggiunta di testo
encoder.add_text(content, chunk_size=500, overlap=50)  # Parametri di chunking qui

# Aggiunta di chunks pre-elaborati
encoder.add_chunks(["chunk1", "chunk2", "chunk3"])  # Non accetta source

# Generazione del video
encoder.build_video(output_video, output_index)

Tecnologia

Questo progetto utilizza la tecnologia Memvid per convertire i dati testuali in codici QR, che vengono poi assemblati in un file video MP4. Questo approccio offre:

Compressione estrema (50-100 volte più piccolo dei database vettoriali tradizionali)
Portabilità (nessuna infrastruttura di database necessaria)
Ricerca semantica veloce anche offline

Name		Name	Last commit message	Last commit date
Latest commit History 229 Commits
.gradio		.gradio
Logo Socrate		Logo Socrate
STATO DEL PROGETTO SOCRATE		STATO DEL PROGETTO SOCRATE
archive		archive
core		core
memvidBeta		memvidBeta
memvid_chat		memvid_chat
static		static
templates		templates
test_files		test_files
tokenOpen		tokenOpen
.env.example		.env.example
.env.test		.env.test
.gitignore		.gitignore
.gitignore.multitenant		.gitignore.multitenant
.python-version		.python-version
ADAPTIVE_PROMPTING_GUIDE.md		ADAPTIVE_PROMPTING_GUIDE.md
CLAUDE.md		CLAUDE.md
DEPLOYMENT_GUIDE.md		DEPLOYMENT_GUIDE.md
DEPLOYMENT_INSTRUCTIONS.md		DEPLOYMENT_INSTRUCTIONS.md
DESIGN_SYSTEM.md		DESIGN_SYSTEM.md
GUIDA_COMPLETA_SISTEMA.md		GUIDA_COMPLETA_SISTEMA.md
MODAL_SETUP_GUIDE.md		MODAL_SETUP_GUIDE.md
ONNX_INTEGRATION_GUIDE.md		ONNX_INTEGRATION_GUIDE.md
Procfile		Procfile
Procfile.railway		Procfile.railway
Procfile.worker		Procfile.worker
QUICK_START_LOCAL.md		QUICK_START_LOCAL.md
README.md		README.md
README_DEPLOY_TRIGGER.txt		README_DEPLOY_TRIGGER.txt
README_MULTITENANT.md		README_MULTITENANT.md
README_simple.md		README_simple.md
api_server.py		api_server.py
app.py		app.py
celery_config.py		celery_config.py
check_api.bat		check_api.bat
check_api.py		check_api.py
check_r2_versions.py		check_r2_versions.py
check_railway_db.py		check_railway_db.py
cleanup_db.sql		cleanup_db.sql
cleanup_old_documents.py		cleanup_old_documents.py
cleanup_orphaned_r2_files.py		cleanup_orphaned_r2_files.py
cleanup_railway_docs.sh		cleanup_railway_docs.sh
debug.py		debug.py
delete_old_documents.py		delete_old_documents.py
docker-compose.dev.yml		docker-compose.dev.yml
esempio_base.py		esempio_base.py
init_db.py		init_db.py
list_documents.py		list_documents.py
migrate_remove_file_data.py		migrate_remove_file_data.py
modal_reranker.py		modal_reranker.py
nixpacks.toml		nixpacks.toml
nixpacks.worker.toml		nixpacks.worker.toml
railway.json		railway.json
railway.worker.json		railway.worker.json
requirements.txt		requirements.txt
requirements_multitenant.txt		requirements_multitenant.txt
requirements_simple.txt		requirements_simple.txt
reset_database.sql		reset_database.sql
reset_db_simple.py		reset_db_simple.py
run.py		run.py
run_cleanup_r2.py		run_cleanup_r2.py
run_esempio.bat		run_esempio.bat
simple_app.py		simple_app.py
start.bat		start.bat
start_async_dev.bat		start_async_dev.bat
start_simple.bat		start_simple.bat
start_worker.sh		start_worker.sh
start_worker_wrapper.py		start_worker_wrapper.py
tasks.py		tasks.py
test_adaptive_prompting.py		test_adaptive_prompting.py
test_api_basic.py		test_api_basic.py
test_async_processing.py		test_async_processing.py
test_cached_model.py		test_cached_model.py
test_database_operations.py		test_database_operations.py
test_document.md		test_document.md
test_inline_embeddings.py		test_inline_embeddings.py
test_memvid.py		test_memvid.py
test_output.txt		test_output.txt
test_r2_connection.py		test_r2_connection.py
test_simple_async.py		test_simple_async.py
worker_healthcheck.py		worker_healthcheck.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Memvid Document Encoder

Cos'è Memvid?

Come usare questa app

Parametri avanzati

Struttura dei file

API di Memvid

Tecnologia

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Memvid Document Encoder

Cos'è Memvid?

Come usare questa app

Parametri avanzati

Struttura dei file

API di Memvid

Tecnologia

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages