Proyecto de análisis de datos usando Python, pandas, PostgreSQL y Docker para el dataset ClassicModels.
- Docker y Docker Compose
- Miniconda/Anaconda
- Git
# 1. Clonar repositorio
git clone https://github.com/tuusuario/classicmodels-analysis.git
cd classicmodels-analysis
# 2. Ejecutar setup completo
./setup.sh
# 3. Iniciar análisis
./start_analysis.shclassicmodels-analysis/
├── README.md # Este archivo
├── setup.sh # Script de configuración
├── start_analysis.sh # Script de inicio rápido
├── docker-compose.yml # Configuración Docker
├── .env # Template de configuración
├── classicmodels-env.yml # Ambiente conda
├── notebooks/
│ ├──Python_dataAnalytics_rrg.ipynb # Análisis
├── funciones/
│ ├── funcionesPrueba.py # Funciones reutilizables
├── data/
│ └── classicmodels.sql # Dataset SQL
└──python_dataAnalytics.yml # Ambiente conda
El proyecto usa un ambiente conda minimalista con:
- Python 3.9
- pandas - Manipulación de datos
- numpy - Computación numérica
- jupyter/jupyterlab - Notebooks interactivos
- psycopg2 - Conector PostgreSQL
- sqlalchemy - ORM y conexiones DB
- matplotlib/seaborn - Visualización básica
- PostgreSQL 15 - Base de datos principal
- Estructura de datos y relaciones
- Calidad de datos y valores faltantes
- Estadísticas descriptivas
- Top 10 clientes por ventas brutas
- Top 10 productos más vendidos
- Clientes activos vs inactivos
- Reportes de actividad
# Gestión del ambiente
conda activate classicmodels # Activar ambiente
conda deactivate # Desactivar ambiente
# Gestión Docker
docker-compose up -d # Iniciar servicios
docker-compose down # Parar servicios
docker-compose logs -f postgres # Ver logs PostgreSQL
# Conexión directa a PostgreSQL
psql -h localhost -p 5432 -U postgres -d classicmodels
# Jupyter Lab
jupyter lab # Desde ambiente activadoleer_tabla(tabla, engine)- Leer tablas desde PostgreSQLfiltrar_por_fechas()- Filtrado temporal de DataFramesgenerar_reporte_pivot()- Reportes agrupadosescribir_tabla_bd()- Escribir DataFrames a PostgreSQL
- Archivo
.enven.gitignore - Credenciales nunca en el código
- Template
.env.examplepara nuevos usuarios - Validación de credenciales por defecto
# Verificar Docker
docker --version
docker-compose --version
# Limpiar containers
docker-compose down -v
docker system prune -f# Reinicializar conda
conda init bash
source ~/.bashrc
# Recrear ambiente
conda env remove -n classicmodels
./setup.sh# Verificar status
docker-compose ps
# Revisar logs
docker-compose logs postgres
# Verificar puerto
netstat -tulnp | grep 5432- Análisis de series temporales
- Modelos predictivos de ventas
- Dashboard interactivo con Streamlit
- Automatización con Apache Airflow
- Fork del proyecto
- Crear rama feature (
git checkout -b feature/nueva-funcionalidad) - Commit cambios (
git commit -am 'Añadir nueva funcionalidad') - Push a la rama (
git push origin feature/nueva-funcionalidad) - Crear Pull Request
Este proyecto está bajo la Licencia MIT - ver el archivo LICENSE para detalles.
📧 Contacto: [email protected]