Скачать 

Машинное обучение: выделение факторов на Python [Центр digital-профессий ITtensive]

Цена: 150 РУБ
Организатор: Rokki
Список участников складчины:
  • 1. rusiko
Rokki
Rokki
Организатор
  • #1

Машинное обучение: выделение факторов на Python [Центр digital-профессий ITtensive]

Ссылка на картинку
Чему вы научитесь
  • Процесс и модель машинного обучения
  • Заполнение пропусков в данных
  • Линейная регрессия и L1/L2 регуляризация
  • Решающие деревья и ансамбли стекинга
  • Корреляция и взаимная информация
  • Метод главных компонент (PCA)
  • Сингулярное разложение (SVD)
  • Анализ независимых компонент (ICA)
  • Многомерное шкалирование (MDS)
  • t-SNE, UMAP, LargeVis
Требования
  • Продвинутый Python
  • Основы математической статистики

Описание
Мы разберем задачу хакатона 2020 года по выделению факторов, в наибольшей степени влияющих на продолжительность жизни в России, с точки зрения фундаментальных и прикладных подходов к понижению размерности данных. В заключении построим ансамбль моделей для предсказания продолжительности жизни, базируясь на выделенных факторах.
Курс разбит на 4 части. В первой части мы последовательно пройдем все этапы работы с данными: от видов задач и их постановки до работы с моделями машинного обучения для минимизации предсказательной ошибки. Дополнительно рассмотрим фундаментальные основы построения моделей машинного обучения, базовые метрики и наиболее простые модели - линейную регрессии, решающие деревья и случайный лес. А также ансамбли машинного обучения.
Во второй части на практике разберем:
  • Очистку и предобработку данных - ETL
  • Линейную регрессию для экстраполяции данных
  • Линейную регрессию с регуляризацией для выделения факторов
  • Информационные критерии понижения размерности
В заключении создадим ансамбль стекинга из простых моделей понижения размерности.
Третья часть посвящена матричным методам:
  • Метод главных компонент (PCA)
  • Сингулярное разложение (SVD)
  • Анализ независимых компонент (ICA)
  • Положительно-определенные матрицы (NMF)
Уточним решение задачи обучения без учителя через матричные методы.
В четвертой части рассмотрим нелинейные подходы:
  • Многомерное шкалирование (MDS).
  • t-SNE
  • UMAP
  • LargeVis
Стабилизируем ансамбль понижения размерности и используем его для предсказания продолжительности жизни в России, основываясь на наиболее важных макроэкономических показателях.
Для кого этот курс:
  • Аналитики Python, изучающие машинное обучение
  • Программисты больших данных
  • Исследователи больших данных
 
Зарегистрируйтесь , чтобы посмотреть скрытый авторский контент.
Похожие складчины
  • в разделе: Программирование
  • в разделе: Программирование
  • в разделе: Программирование

Войдите или зарегистрируйтесь, чтобы комментировать и скачивать складчины!

Учетная запись позволит вам участвовать в складчинах и оставлять комментарии

Регистрация

Создайте аккаунт на форуме. Это не сложно!

Вход

Вы уже зарегистрированы? Войдите.

Сверху