Материалы по курсу сореновантельного анализа данных
Введение в соревновательный Data Science
- 1.1 🎬 Что даст тебе этот курс?
- 1.2
✈️ Суть соревновательного анализа данных - 1.3 🤼♀️ А с кем и где будем соревноваться в курсе?
А ты думал сразу стакать будем?!
- 2.1 🎓🐍 Пишем и организуем код
- 2.2 🎓🐼 Pandas. Забудь про циклы! 🐍
- 2.3 💾📈 Данные и визуализация. Куда двигаться?!
- 2.4 🦾🤖 Валидация и модели
Перед тем как накидывать модели, выжмем максимум из данных
- 3.1 💪🐼 Pandas мощнее, чем ты думаешь!
- 3.2 👀🚗 Визуализация. Как понять, где модель косячит?
- 3.3 🤜🦈Генерируем новые признаки и увеличиваем точность
- 3.4 ☂️ Фильтрация признаков
- 3.5 🦆🔥 Секретный гость (Интервью с KGM)
Знать как устроены модели мало, надо уметь их оптимизировать
- 4.1 😺🚀 CatBoost + Feature Engineering
- 4.2 🦄🎳 LightGBM + Feature Engineering
- 4.3 👽🔱 XGBoost + Feature Engineering
- 4.4 🌳🌲🌴 Бустинги. Практика
- 4.5 🎯 Вспоминаем, что у нас целых два таргета!
- 4.6 🦆🔥 Секретный гость (Советы от KGM)
Жмем Shift + Tab и подбираем гипер-параметры моделей автоматически
- 5.1 🎣 Автоматическая генерация и фильтрация признаков
- 5.2 ⚙️ Не время блендить, давайте выжмем еще!
- 5.3 🤹♂️Трюки и хитрости
- 5.4 ✏️ Hard упражнения по Pandas и Numpy для любопытных
- 5.5 🦆🔥 Секретный гость (Секреты от KGM)
И один ты в поле воин, если твой ансамбль из сотни скроен.
- 6.1 ⚔️ Блендинг. Смешай и точность вырастет!
- 6.2 💎 Стекинг. Точность снова выросла, да ну на?!
- 6.3 🦏 Автоматический блендинг и стекинг. Sklearn-Pipelines
- 6.4 🦆🔥 Секретный гость (Истории от KGM)
Помоги своему пайплайну дышать свободнее
- 7.1 ⏱ Оптимизация памяти и ускорение вычислений
- 7.2 🧹 Парсинг внешних данных
- 8.1 Полное baseline решение. Бей его!
- 8.2 🚢 Работа с платформой Kaggle и Kaggle API
- 8.3 🌈 Google Colab, Paper Space, Yandex Cloud и другие
Этих главы не обязательны для получения сертификата за курс, но эти главы выделят тебя на фоне остальных.
- 9.1 🧠 А нейронки будут ?!
- 9.2 🚚 Продвинутый Feature Engineering
- 9.3 🏋️♂️🏌️♂️ Weigths & Biases
- 9.4 👩🎤👨🎤💡Работа в команде
Предупрежден - значит вооружен!
- 10.1 🎲 Работа с метрикой. Пре-процессинг и пост-процессинг
- 10.2 🎭 Псевдолейблинг
- 10.3 🏹 Пробиваем лидерборд
- 11.1 Ну вот и все. Что дальше?
Ссылка на курс: https://stepik.org/a/108888
- Миленькин Александр (@Aleron75)
- Александров Иван (@ivanich_spb)