Аналитика Big Data для руководителей и менеджеров
Продолжительность: 3 дня, 24 академических часа.
Курс ориентирован на руководство государственных предприятий и частных компаний, менеджеров и специалистов, которые хотят получить расширенные знания по инструментам и методам анализа больших данных для участия в проектах Big Data и цифровизации бизнеса.
Уровень подготовки: предварительный опыт не требуется.
В рамках Вы узнаете базовые и расширенные методы аналитики, в т.ч. техники поиска и извлечения знаний из больших массивов разнородных данных. Также рассматриваются различные версии дистрибутивов платформы Hadoop, облачные сервисы для хранения и аналитики больших данных, «open source« и коммерческие инструменты.
Подробно изучаются сценарии применения технологий работы с Большими Данными в организациях государственного сектора и различных отраслях бизнеса: банки и финансовые учреждения, промышленность, торговля, транспорт и др. На практических примерах вы узнаете все особенности процессов инициации проектов цифровой трансформации, от сбора данных до формирования команды. Также детально познакомитесь с каждой фазой жизненного цикла работы с Big Data: подготовка данных, выбор модели, пилотное развертывание и тестирование прототипа, промышленная эксплуатация.
Аудитория
Данный курс предназначен для руководителей, топ-менеджеров желающих получить знания по инструментам и методам анализа больших данных.
Программа
Введение в Big Data (Большие данные)
- Большие данные и цифровизация бизнеса
- Методы аналитики больших данных
- Отраслевая специфика аналитики больших данных
- Сценарии применения технологий больших данных
- Жизненный цикл аналитики данных: получение данных, подготовка данных, планирование модели, построение модели, проверка результатов, внедрение
- Формирование озера данных Data Lake
Data Mining — извлечение знаний из больших данных
- Задачи и техники Data Mining
- Классификация и кластеризация
- Прогнозирование и визуализация
- Ассоциативные правила и обнаружение аномалий
- Методология CRISP-DM, SEMMA
- Инструменты Data Mining
- Специфика применения Data Mining для разных отраслей бизнеса с примерами
Машинное обучение для Data mining
- Основные определения
- Задачи и область применения машинного обучения
- Supervised/unsupervised машинное обучение
- Инструменты и технологии машинного обучения
Data mining в социальных сетях
- Введение в анализ социальных сетей и теорию графов
- Базовые алгоритмы на графах и основные возможности графового анализа
- Феномен маленького мира
- Выделение важных узлов в социальных сетях
- Инструменты и методы визуализации графов для применения в бизнесе
Инструментарий для работы с Big Data
- Специфика работы с Big Data
- Аналитика для неструктурированных данных с использованием Hadoop
- Назначение и характеристика компонент экосистемы Apache Hadoop для хранения и обработки Big Data
- Сравнительный анализ Hadoop дистрибутивов (Arenadata Hadoop, Cloudera, Horton Works, MapR) и инструментарий аналитика данных на примерах использования
- Сравнительные характеристики программных и аппаратных решений для реализации решений по Big Data
- Облачные платформы (AWS, EMR, Azure) для реализации решений по Big Data
- Средства визуализации для аналитики данных.
Интеграция Больших данных
- Основные принципы работы с Big Data
- Импорт и экспорт данных с Hadoop (SQL, NoSQL, HDFS, NFS, потоковые данные, web content, файлы логов, социальные сети)
- Пакетная и динамическая загрузка данных
Правовые аспекты организации защиты персональных данных
- Правовое регулирование в области защиты персональных данных
- Международная практика в области защиты персональных данных
- Права субъекта и обязанности оператора при обработке персональных данных
- Виды нарушений безопасности персональных данных
- Стандарт GDRP
С чего начать?
- Формирование команды проекта Big Data. Ключевые роли
- Специфика рынка данных и аналитики
- Использование подходов Agile и DevOps
- Методологии для стандарты
- Отличия подходов Business Intelligence и Data Science
- Сравнительные характеристики программных и аппаратных решений для реализации решений по Big Data.
- Лекции 0
- Тесты 0
- Учебное время 50 hours
- Навык Все уровни
- Язык English
- Студенты 0
- Оценки Да