Repositorio del tercer proyecto individual del bootcamp Henry.
Este proyecto está enfocado en el perfil de analista de datos. El objetivo fue desarrollar un análisis sobre los accidentes de aviones producidos desde 1908. Algunos de los requisitos fueron:
- Realizar un EDA.
- Armar una base de datos.
- Hacer un dashboard a partir de los datos en la base de datos.
- Un informe de calidad.
En este repositorio se encuentran la mayoría de los requisitos listados anteriormente
- El EDA, con la transformación exacta, extracción de datos y obtención de datos para el dashboard se encuentra en
EDA.ipynb
. - La base de datos se encuentra en el archivo .sql en la carpeta
database
. - El reporte de calidad, donde se encuentra un resumen del EDA y la descripción de los campos en el dataset se encuentra en
reporte_calidad.ipynb
Los datos proporcionados para este proyecto se encuentran en la carpeta de dataset.
Los notebooks requieren Python <= 3.8.13. Primero hay que clonar el repositorio:
git clone https://github.com/marianaiv/analytics_Pi03
Entre al repositorio:
cd datathon-henry
Cree un entorno virtual desde el archivo enviroment.yml
usando conda y luego activelo:
conda env create -f environment.yml
conda activate analytics-env
El uso de este trabajo está licenciado bajo GNU General Public License v3.0 (GNU GPLv3).