IT-школа TALAP: Обучение Data Science через проектную деятельность

Дисциплина Data Science появилась недавно, но уже стала одной из самых востребованных в IT-образовании. А сейчас ее коренным образом из еще и меняют успехи искусственного интеллекта. Поэтому проектируя наш полугодовой курс обучения “Data Science”, мы объединили изучение анализа данных и самых популярных и востребованных сегодня в мире технологий машинного обучения.

Наши слушатели изучали прикладные аспекты искусственного интеллекта и его использование в анализе данных, основы статистики и машинного обучения, приемы обработки изображений и естественного языка, знакомились с особенностями использования такой важной новинки, как генеративные нейронные сети. Такой более широкий подход, чем непосредственное использование прикладных инструментов Data Science дает нашим выпускникам багаж, позволяющий нашим выпускникам развиваться дальше, становясь полноценными разработчиками или квалифицированными заказчиками интеллектуальных систем.

Важно, что это не просто знания, пусть и напрямую полученные от одного из авторитетных специалистов в области. Курс IT-школы TALAP был построен по проектной модели – в его ходе слушатели создавали практические решения задач, взятых из их же практики и опирающихся на личные интересы студента или его потребности на работе. Такой подход позволяет гораздо глубже понять изучаемые технологии, а заодно и сформировать портфолио для специалиста, только погружающегося в новую область деятельности. В результате своего обучения наши выпускники имеют возможность предъявить работодателю не просто диплом, а реальный результат своего труда – что на IT-рынке ценится гораздо выше.

«Обучение на курсе построено таким образом, что учащиеся с самого начала ориентированы на практическое применение полученных знаний. Поэтому в начале курса мы рассматриваем вопросы применения ИИ в бизнесе, и учимся использовать готовые интеллектуальные сервисы и предобученные модели – говорит Дмитрий Сошников, основной лектор курса, доцент МАИ и НИУ ВШЭ, ранее ведущий эксперт по искусственному интеллекту и машинному обучению Microsoft. – По каждому из разделов курса студенты реализуют оригинальные мини-проекты, среди которых уже сейчас можно отметить несколько крайне интересных - например, исследование способности ИИ автоматически иллюстрировать художественные произведения, или анализ тональности постов экономической направленности в социальных сетях, что позволяет посмотреть, как соотносятся макроэкономические показатели (инфляция, базовая ставка и т.д.) с настроениями аудитории. Некоторые учащиеся в качестве проекта реализовали прототип чат-бота в актуальной для них области, например для первичного общения с целевой аудиторией и сбора данных. Такая практическая направленность проектов позволяет нашим студентам всё время чувствовать пользу от получаемых знаний и навыков, а также нарабатывать некоторое портфолио проектов».

Итоговые работы могли выполняться студентами как индивидуально, так и в командах, что позволяет развивать навыки коллективной работы и обмена знаниями, являющиеся важным аспектом работы в сфере Data Science. Чтобы была понятна широта интересов слушателей IT-школы TALAP, в качестве примера приведем несколько работ:

  • Султан Касенов в своем проекте "Дообучение генеративной сети с помощью технологии Dreambooth" использовал модель генерации глубокого обучения Dreambooth. Он смог обучить эту модель своему лицу, а также создать совершенно новый стиль ( на основании стиля игры grand theft auto). Для повышения качества генерируемых изображений Султан произвел разметку обучающего датасета и в итоге модель генерирует изображения в этом стиле с высокой точностью. Пример получаемых изображнений вы можете видеть на обложке этого поста.
  • Рустам Бекишев и Диас Кумарбеков в своем совместном проекте автоматизировали процесс извлечения данных из финансовых отчетностей компаний в формате PDF. Они использовали библиотеку Poppler для рендеринга PDF-файлов и провели процедуры распознавания данных и их извлечения. Фрагменты информации выделялись с помощью Detectron на основе предобученных моделей, после чего использовался подход оптического распознавания символов (OCR) с помощью Tesseract. Полученные результаты также были дообработаны при помощи регулярных выражений для дальнейшей аналитики.
  • Маржан Иманбазарова создала полезный медицинский проект, связанный с распознаванием пневмонии на основе рентгеновских фотографий. Она использовала датасет с рентгеновскими изображениями, собранный с сайта Kaggle.com, и обучила модель с использованием библиотеки Keras. Ее модель позволяет прогнозировать заболевание с высокой точностью, что имеет важное значение для своевременной диагностики и принятия мер по предотвращению пневмонии.
  • Аскар Кысыков, Адильжан Аульбеков и Данил Лузгин разработали мобильное приложение "GolyakOFF" на основе Flutter. Приложение позволяет пользователям отслеживать расходы, сканируя квитанции и классифицируя товары с помощью модели машинного обучения. Оно предоставляет возможность выявлять структуру расходов по категориям и сканировать чеки с помощью встроенного сканера QR-кода. Для создания модели использовались технологии веб-парсинга, веб-скраппинга и библиотека машинного обучения scikit-learn.

Вместе с нашими слушателями мы благодарим организаторов программы TechOrda, которая позволила им пройти интересное практически ориентированное обучение в IT школе TALAP и погрузиться в новую сферу, расширяющую их профессиональные возможности.

Комментарии 0

Авторизуйтесь чтобы оставить комментарий