Este proyecto ha sido desarrollado en el marco de la asignatura Fundamentos del Aprendizaje Automático con el objetivo de aplicar técnicas de aprendizaje automático para la predicción de sequías. La motivación detrás del proyecto es analizar si es posible predecir sequías a partir de datos meteorológicos utilizando técnicas de clasificación supervisada.
El conjunto de datos utilizado para este proyecto proviene de Kaggle: Predict Droughts using Weather & Soil Data. Este dataset es de clasificación, con seis niveles de sequía, que se detallan a continuación:
- Ninguna sequía
- Sequía leve
- Sequía moderada
- Sequía severa
- Sequía extrema
- Sequía excepcional
El conjunto de datos fue creado gracias a datos abiertos proporcionados por el NASA POWER Project y los autores del US Drought Monitor. Los datos meteorológicos utilizados provienen del NASA Langley Research Center. Además, se incluyen datos del suelo proporcionados por la Harmonized World Soil Database.
- Pandas
- NumPy
- LightGBM
- Bayesian Optimization
- SMOTE (imblearn)
- SHAP
- Scikit-learn
- Matplotlib y Seaborn
Los datos meteorológicos fueron proporcionados por el NASA POWER Project y el U.S. Drought Monitor, mientras que los datos del suelo provienen de la Harmonized World Soil Database.