Публикация была переведена автоматически. Исходный язык: Русский
Тема выпуска: базовые принципы ML и простые алгоритмы обучения.
Если пробежаться галопом по Европе, то после того, как вы освоили базовые операции в библиотеках numpy, pandas, sklearn и смогли сделать свою первую учебную посылку в соревновании на kaggle, то можно переходить на более глубокий уровень понимания происходящего. Это непосредственно сами алгоритмы (математика) и инженерная чуйка (практика использования).
Вам необходимо познакомиться с различными семействами алгоритмов и понять интуицию их работы:
1. Метрические алгоритмы (e.g. kNN)
2. Логические алгоритмы (e.g. деревья)
3. Вероятностные алгоритмы (e.g. Naive Bayes)
4. Линейные модели и их расширения
С точки зрения математики вам нужно понять, что именно делает процедура кросс-валидации (подсказка #1: не все это понимают; подсказка #2: но мы вам можем объяснить доступным языком на занятиях, что такое оценка математического ожидания эмпирического риска).
Вишенкой на торте (и вашей отличительной чертой в портфолио) может стать опыт использования и глубокого понимания полезных трюков для получения качественных моделей машинного обучения (см. скриншот). Очень простой и мощный подход, называемый Learning Curves (кривые обучения), на удивление, довольно малоизвестен. Чтобы получить теорию и практический опыт по этой части мы рекомендуем посмотреть mini-tutorial от sklearn: Plotting Learning Curves and Checking Models’ Scalability.
А для закрепления понимания, научиться отвечать и дискутировать на вопросы:
Что нужно делать (и нужно ли), когда:
1. Ошибка на обучении высокая?2. Ошибка на обучении низкая?3. Ошибка на обучении немного ниже, чем на тесте?4. Ошибка на обучении существенно ниже, чем на тесте?
С уважением, Алексей Драль, Кирилл Власов, Эмели Драль — авторы 2-го учебного модуля "Базовые принципы ML и простые алгоритмы обучения" и ваши инструкторы Практического курса по Machine Learning.
Полезная информация
Предыдущий выпуск: ч.1 введение в ML и библиотеки ML для Python
Сохраните и подпишитесь, если хотите быть востребованным в IT
BigData Team: the way you learn best
Тема выпуска: базовые принципы ML и простые алгоритмы обучения.
Если пробежаться галопом по Европе, то после того, как вы освоили базовые операции в библиотеках numpy, pandas, sklearn и смогли сделать свою первую учебную посылку в соревновании на kaggle, то можно переходить на более глубокий уровень понимания происходящего. Это непосредственно сами алгоритмы (математика) и инженерная чуйка (практика использования).
Вам необходимо познакомиться с различными семействами алгоритмов и понять интуицию их работы:
1. Метрические алгоритмы (e.g. kNN)
2. Логические алгоритмы (e.g. деревья)
3. Вероятностные алгоритмы (e.g. Naive Bayes)
4. Линейные модели и их расширения
С точки зрения математики вам нужно понять, что именно делает процедура кросс-валидации (подсказка #1: не все это понимают; подсказка #2: но мы вам можем объяснить доступным языком на занятиях, что такое оценка математического ожидания эмпирического риска).
Вишенкой на торте (и вашей отличительной чертой в портфолио) может стать опыт использования и глубокого понимания полезных трюков для получения качественных моделей машинного обучения (см. скриншот). Очень простой и мощный подход, называемый Learning Curves (кривые обучения), на удивление, довольно малоизвестен. Чтобы получить теорию и практический опыт по этой части мы рекомендуем посмотреть mini-tutorial от sklearn: Plotting Learning Curves and Checking Models’ Scalability.
А для закрепления понимания, научиться отвечать и дискутировать на вопросы:
Что нужно делать (и нужно ли), когда:
1. Ошибка на обучении высокая?2. Ошибка на обучении низкая?3. Ошибка на обучении немного ниже, чем на тесте?4. Ошибка на обучении существенно ниже, чем на тесте?
С уважением, Алексей Драль, Кирилл Власов, Эмели Драль — авторы 2-го учебного модуля "Базовые принципы ML и простые алгоритмы обучения" и ваши инструкторы Практического курса по Machine Learning.
Полезная информация
Предыдущий выпуск: ч.1 введение в ML и библиотеки ML для Python
Сохраните и подпишитесь, если хотите быть востребованным в IT
BigData Team: the way you learn best