Публикация была переведена автоматически. Исходный язык: Русский
Machine Learning или машинное обучение сегодня звучат почти в каждой сфере — от банков и телекома до ритейла, госуслуг и горнорудной отрасли. Но за громкими словами чаще всего скрывается довольно простая идея.
Разберёмся, как ML работает на базовом уровне, без сложной математики и формул.
На самом деле машинное обучение — это не «магия». В основе ML лежат математические модели предсказания, которые учатся прогнозировать определённый тип переменной.
Все целевые переменные в ML можно условно разделить на два типа:
- количественные
- качественные
Количественные переменные отвечают на вопрос: «Сколько?»
Это числовые значения, которые можно измерить.
- количество посетителей магазина по дням недели
- средний чек клиента
- сумма покупок за месяц
- количество выданных банковских карт
- объём потребления услуг связи
Сколько кредитных карт будет выдано клиентам определённого сегмента в следующем месяце?
Для таких задач используются регрессионные модели, которые предсказывают конкретное числовое значение.
Качественные переменные отвечают на вопрос: «Произойдёт или нет?» / «Кто?» / «К какой группе относится?»
Чаще всего это:
- классы
- категории
- вероятности события
- вероятность оттока клиента
- вероятность покупки продукта
- мужчина или женщина
- клиент уйдёт / не уйдёт
- платёж будет просрочен / не будет
Какова вероятность того, что клиент уйдёт из телеком-оператора в течение ближайших 30 дней?
Здесь применяются классификационные модели, которые оценивают вероятность наступления события, а именно уйдет ли клиент в категорию оттока или нет.
И количественные, и качественные модели строятся на предикторах — входных данных, на основе которых модель учится делать прогноз.
- возраст
- пол
- доход или зарплата
- активность в мобильном приложении
- количество сессий
- история покупок
- длительность обслуживания
- регион
Важно понимать: одни и те же предикторы могут использоваться для разных задач, но целевая переменная всегда одна и она определяет тип модели
Целевая переменная (качественная, она же отток):
- уйдёт / не уйдёт клиент
- вероятность оттока
Предикторы:
- частота звонков
- потребление интернета
- жалобы
- стаж клиента
- тариф
Результат: список клиентов с вероятностью оттока, на которых можно направить удерживающие предложения.
Целевая переменная (количественная):
- количество карт в месяц
Предикторы:
- маркетинговые кампании
- сезонность
- регион
- сегменты клиентов
Результат: прогноз нагрузки на отделения и планирование ресурсов.
Машинное обучение — это не про «разум», а про предсказание.
Всё ML сводится к трём ключевым вопросам:
- Что мы хотим предсказать? → количественную или качественную переменную
- Какие данные на это влияют? → предикторы
- Какую бизнес-задачу это решает?
Понимание разницы между количественными и качественными переменными — это первый шаг к осознанному использованию ML, а не слепому следованию хайпу.
Для более глубокого понимания целевых переменных и предикторов, рекомендуем прослушать бесплатные курсы Института биоинформатики на платформе Stepik «Основы Статистики» часть 1 и часть 2, где часть 1 рассказывает о количественных переменных, а часть 2 о качественных.
Ссылки на курсы приложены ниже:
https://stepik.org/course/76/info
https://stepik.org/course/524/info
Machine Learning или машинное обучение сегодня звучат почти в каждой сфере — от банков и телекома до ритейла, госуслуг и горнорудной отрасли. Но за громкими словами чаще всего скрывается довольно простая идея.
Разберёмся, как ML работает на базовом уровне, без сложной математики и формул.
На самом деле машинное обучение — это не «магия». В основе ML лежат математические модели предсказания, которые учатся прогнозировать определённый тип переменной.
Все целевые переменные в ML можно условно разделить на два типа:
- количественные
- качественные
Количественные переменные отвечают на вопрос: «Сколько?»
Это числовые значения, которые можно измерить.
- количество посетителей магазина по дням недели
- средний чек клиента
- сумма покупок за месяц
- количество выданных банковских карт
- объём потребления услуг связи
Сколько кредитных карт будет выдано клиентам определённого сегмента в следующем месяце?
Для таких задач используются регрессионные модели, которые предсказывают конкретное числовое значение.
Качественные переменные отвечают на вопрос: «Произойдёт или нет?» / «Кто?» / «К какой группе относится?»
Чаще всего это:
- классы
- категории
- вероятности события
- вероятность оттока клиента
- вероятность покупки продукта
- мужчина или женщина
- клиент уйдёт / не уйдёт
- платёж будет просрочен / не будет
Какова вероятность того, что клиент уйдёт из телеком-оператора в течение ближайших 30 дней?
Здесь применяются классификационные модели, которые оценивают вероятность наступления события, а именно уйдет ли клиент в категорию оттока или нет.
И количественные, и качественные модели строятся на предикторах — входных данных, на основе которых модель учится делать прогноз.
- возраст
- пол
- доход или зарплата
- активность в мобильном приложении
- количество сессий
- история покупок
- длительность обслуживания
- регион
Важно понимать: одни и те же предикторы могут использоваться для разных задач, но целевая переменная всегда одна и она определяет тип модели
Целевая переменная (качественная, она же отток):
- уйдёт / не уйдёт клиент
- вероятность оттока
Предикторы:
- частота звонков
- потребление интернета
- жалобы
- стаж клиента
- тариф
Результат: список клиентов с вероятностью оттока, на которых можно направить удерживающие предложения.
Целевая переменная (количественная):
- количество карт в месяц
Предикторы:
- маркетинговые кампании
- сезонность
- регион
- сегменты клиентов
Результат: прогноз нагрузки на отделения и планирование ресурсов.
Машинное обучение — это не про «разум», а про предсказание.
Всё ML сводится к трём ключевым вопросам:
- Что мы хотим предсказать? → количественную или качественную переменную
- Какие данные на это влияют? → предикторы
- Какую бизнес-задачу это решает?
Понимание разницы между количественными и качественными переменными — это первый шаг к осознанному использованию ML, а не слепому следованию хайпу.
Для более глубокого понимания целевых переменных и предикторов, рекомендуем прослушать бесплатные курсы Института биоинформатики на платформе Stepik «Основы Статистики» часть 1 и часть 2, где часть 1 рассказывает о количественных переменных, а часть 2 о качественных.
Ссылки на курсы приложены ниже:
https://stepik.org/course/76/info
https://stepik.org/course/524/info