Skip to content

Este repositorio es un portafolio diseñado específicamente para ayudarte a adquirir las habilidades necesarias para convertirte en un Data Scientist para Binary Brains.

Notifications You must be signed in to change notification settings

EduDN/100Days100Proyects_DataScientist

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 

Repository files navigation

100Days100Proyects_DataScientist

Este repositorio es un portafolio diseñado específicamente para ayudarte a adquirir las habilidades necesarias para convertirte en un Data Scientist para Binary Brains.


Proyecto de Portafolio para Data Scientists: Niveles Básico, Intermedio y Avanzado

Nivel Básico (Días 1-20): Fundamentos y Manipulación de Datos

  • Introducción a Python para Data Science.
  • Manipulación de datos con pandas.
  • Visualización de datos con matplotlib.
  • Visualización de datos con seaborn.
  • Análisis exploratorio de datos (EDA) básico.
  • Estadísticas descriptivas con pandas.
  • Trabajo con archivos CSV y Excel.
  • Limpieza de datos.
  • Filtrado y selección de datos con pandas.
  • Visualización de datos con gráficos interactivos (por ejemplo, usando plotly).
  • Análisis de correlaciones.
  • Creación de gráficos de dispersión (scatter plots).
  • Histogramas y distribuciones de probabilidad.
  • Visualización de series temporales.
  • Introducción a la manipulación de fechas y tiempos.
  • Introducción a la inferencia estadística.
  • Pruebas de hipótesis básicas.
  • Regresión lineal simple con scikit-learn.
  • Regresión lineal múltiple con scikit-learn.
  • Introducción a los modelos de clasificación con scikit-learn.

Nivel Intermedio (Días 21-50): Machine Learning y Modelado Avanzado

  • Modelos de clasificación avanzados (por ejemplo, Random Forest, SVM).
  • Modelos de regresión no lineal (por ejemplo, Regresión Polinómica).
  • Validación cruzada y evaluación de modelos.
  • Optimización de hiperparámetros.
  • Análisis de componentes principales (PCA).
  • Clustering con K-Means.
  • Clustering jerárquico.
  • Redes Neuronales Artificiales (ANN) con Keras.
  • Redes Neuronales Convolucionales (CNN) con Keras.
  • Redes Neuronales Recurrentes (RNN) con Keras.
  • Aprendizaje por refuerzo (Reinforcement Learning).
  • Procesamiento de lenguaje natural (NLP) básico con nltk o spaCy.
  • Construcción de chatbots básicos con nltk o ChatterBot.
  • Análisis de sentimiento en texto con nltk o VADER.
  • Análisis de tópicos y clasificación de documentos con lda2vec.
  • Análisis de redes sociales con NetworkX.
  • Detección de anomalías con técnicas estadísticas y de machine learning.
  • Sistemas de recomendación con filtrado colaborativo.
  • Sistemas de recomendación basados en contenido.
  • Implementación de una pipeline de machine learning.

Nivel Avanzado (Días 51-100): Proyectos Especiales y Avanzados

  • Creación de un sistema de recomendación en tiempo real.
  • Predicción de series temporales (por ejemplo, con LSTM).
  • Detección de fraude en transacciones financieras.
  • Modelos de detección de objetos en imágenes.
  • Análisis de imágenes médicas con Deep Learning.
  • Traducción automática de texto con modelos de NLP avanzados.
  • Implementación de GANs (Generative Adversarial Networks).
  • Proyecto de visión por computadora: clasificación de objetos en imágenes.
  • Proyecto de procesamiento de lenguaje natural: generación de texto.
  • Creación de un chatbot avanzado con procesamiento de lenguaje natural.

Proyectos Especiales Avanzados (Días 51-100):

  • Desarrollo de un sistema de recomendación de música basado en gustos y contexto del usuario.
  • Implementación de un sistema de reconocimiento facial con alta precisión.
  • Análisis de sentimiento en redes sociales en tiempo real.
  • Creación de un sistema de recomendación personalizado para e-commerce.
  • Desarrollo de un asistente virtual con capacidades de procesamiento de lenguaje natural y reconocimiento de voz.
  • Creación de un sistema de clasificación de noticias y detección de noticias falsas.
  • Desarrollo de un sistema de recomendación de películas basado en preferencias y comportamiento del usuario.
  • Análisis de opiniones de productos en tiempo real para una empresa de comercio electrónico.
  • Creación de un sistema de reconocimiento de objetos en tiempo real con baja latencia.
  • Desarrollo de un sistema de recomendación de libros basado en perfiles de lectura y preferencias.

¡Espero que encuentres estos proyectos útiles y desafiantes para tu desarrollo como Data Scientist! Si tienes preguntas o sugerencias, no dudes en abrir un issue o contactarme. ¡Disfruta explorando y aprendiendo!

About

Este repositorio es un portafolio diseñado específicamente para ayudarte a adquirir las habilidades necesarias para convertirte en un Data Scientist para Binary Brains.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published