Basic track on unsupervised ML in russian
Здесь лежит мини-курс про обучение без учителя.
Сейчас он состоит из 3 тетрадок:
- Понижение размерности и embedding-методы Перед прохождением нужно рассказать,
- зачем нужно понижение размерности (предобработка перед обучением, визуализация, ужатие, etc.)
- как работают линейные методы понидения размерности на пальцах [pca "ищет оси, вдоль которых данные меняются", TruncatedSVD "пытается ужать данные так, чтобы потом было можно разжать с минимальной ошибкой"].
- что такое embedding и как он работает на примере MDS. Отличие tSNE от MDS "на пальцах" (пытается сохранить расстояние только до ближайших соседей)
- Базовая кластеризация и EM Перед прохождением нужно рассказать,
- Что такое кластеризация и нафига она нужна
- как работает Kmeans на пальцах (просто объяснить алгоритм).
- Что такое правдоподобие и как работает EM на пальцах. (просьба упомянуть, что он может не только gaussian mixture)
- Лаба про анализ мозга "зеброрыбы" (Danio Rerio) Всё внутри. Задача - применить все полученные знания для кейса из биологии.
- Какой-то скетч идей расширения есть тут #1
- Если у вас есть идеи - милости просим в Issues
- Если хотите законтрибутить - милости просим в Pull Requests