Аналитик данных
Контакты:
-
Александр Александрович АгапитовПреподаватель
-
Ирина Александровна ЛакманПреподаватель
-
Лиана Флоритовна СадиковаПреподаватель
-
Венера Маратовна ТимирьяноваПреподаватель
Программа разработана в соответствии с профессиональными стандартом ПС 06.042 «Специалист по большим данным», утв. приказом Мин. труда и социальной защиты РФ
Цель реализации программы: формирование у слушателей профессиональных компетенций необходимых для выполнения профессиональной деятельности в соответствии с профессиональным стандартом ПС 06.042 «Специалист по большим данным».
Категория слушателей: граждане, имеющие или получающие среднее профессиональное или высшее образование
Форма обучения: очно-заочная с применением ДОТ, заочная с применением ДОТ
Результаты обучения:
В результате освоения программы слушатель должен приобрести следующие знания и умения:
знать:
– классификацию типов наборов данных;
– методы сбора и подготовки исходных данных;
– методы работы с датасетами в R (объединение, селекция, фильтрация, и др.).
– методы графической поддержки аналитических исследования; – Методы формирования отчетов в Markdown.
– методы формирования шайни-документов (графические объекты), в том числе картограммы.
– технологии семплирования для получения сбалансированных выборок;
– основные современные методы анализа количественных и факторных данных;
– методы валидации и кросс-валидации при обучении алгоритмов машинного обучения;
– алгоритмы машинного обучения – бинарные модели регрессии, модели регрессии (метод лассо и гребневой регрессии); байесовские классификаторы, алгоритмы бустинга, методы деревьев решений и случайного леса);
– ансамблевые процедуры в машинном обучения;
– алгоритмы обработки входной информации, с применением современных инструментальных средств;
– методы предварительной обработки информации (метод главных компонент, кластерный анализ) для возможности применения продвинутых методов анализа данных;
– метрики качества для оценки алгоритмов машинного обучения;
– методы опорных векторов для решения задач классификации; – методы подбора нелинейного ядра для решения задач методом опорных векторов;
– методы работы с виртуальной машиной;
– методы парсинга данных в сети интернет;
– структуру HTML документа, структуру и параметры HTML тегов, объектную модель DOM;
– методы интеграции решений на R в Информационные системы.
уметь:
– проводить качественную чистку данных, проводить восполнение данных;
– восполнять выборку до сбалансированного объема;
– проводить процедуры валидации и кросс-валидации для обучения алгоритмов машинного обучения;
– использовать метрики качества для оценки алгоритмов машинного обучения;
– использовать алгоритмы машинного обучения для решения задач классификации;
– использовать алгоритмы машинного обучения для решения задач регрессии;
– проводить ансамблирование алгоритмов машинного обучения для повышения точности решения задач классификации и регрессии;
– применять техники сэмплирования для восполнения баланса выборок, используя средства среды R Studio;
– строить модели на основе алгоритмов машинного обучения для решения задач регрессии и классификации;
– использовать методы машины опорных векторов для задач классификации;
– использовать наивный байесовский классификатор для классификации текстовых сообщений;
– проводить оценку качества алгоритмов машинного обучения;
– ориентироваться в стандарте исключений для роботов сайта; – извлекать HTML тексты и анализировать их содержимое с помощью библиотек R.
– формировать отчеты в R Markdown в виде pdf, Word и HTML страниц (в том числе проводить широкую графическую поддержку анализа).
Срок обучения: 4 месяца (17 недель)
Объем программы: 360 ч
Итоговый документ: По итогам обучения выдаётся диплом установленного образца о прохождении профессиональной переподготовки с присвоением квалификации «Специалист по анализу больших данных».
Подать заявку на обучение в рамках проекта Содействие занятости
Подключение к программе ТОЛЬКО администратором на основании приказа о зачислении
Руководитель программы Лакман Ирина Александровна