Введение
в анализ данных
Курс от проекта «Код Будущего»
Пройди полноценное обучение программированию за счёт государства
152 часа
Длительность курса
Возрастная категория
14-18 лет
Онлайн
Формат обучения
Уровень сложности
Базовый
Модуль 1
Основы языка Python
14 практических заданий
36 часов
12 лекций
10 самостоятельных
Тема 1.1 Инструктаж по технике безопасности. Установка программного обеспечения и подключение к сервисам
Тема 1.2 Условные и циклические операторы в языке Python
Тема 1.3 Встроенные функции, строки, символы и регулярные выражения
Тема 1.4 Списки, кортежи, множества и диапазоны
Тема 1.5 Работа с датой и временем, обработка исключений
Тема 1.6 Пользовательские функции
Тема 1.7 Модули и пакеты
Тема 1.8 Работа с файлами и каталогами
Тема 1.9 Объектно-ориентированное программирование
Лекции:
Практика:
Решение упражнений в Google Colab по теме типов данных в Python. Написать все коды практической работы с применением Google Colab по теме "Условные и циклические операторы в языке Python"
Решение упражнений в Google Colab по теме "Встроенные функции, строки, символы и регулярные выражения"
Решение упражнений в Google Colab по теме "Списки, кортежи, множества и диапазоны"
Решение упражнений в Google Colab по теме "Работа с датой и временем, обработка исключений"
Решение упражнений в Google Colab по теме "Пользовательские функции"
Решение упражнений в Google Colab по теме "Модули и пакеты"
Решение упражнений в Google Colab по теме "Работа с файлами и каталогами"
Модуль 2
Введение в аналитику данных. Python для анализа данных
18 практических заданий
40 часов
4 лекции
18 самостоятельных
Тема 2.1. Введение в сводные таблицы
Тема 2.2. Применение сводных таблиц для маркетинговой сегментации
Тема 2.3. Создание отчетов в Google Looker Studio
Тема 2.4. Применение машинного обучение к данным в Google Таблицах
Тема 2.5. Обзор типов данных Pandas
Тема 2.6. Библиотеки визуализации данных Matplotlib, Seaborn, Altair, Autoviz, Plotly Express
Тема 2.7. Применение pandas для анализа и обработки данных
Тема 2.8. Разведочный анализ данных с использованием библиотек Pandas Profiling, Sweetviz, Dataprep, D-Tale, Mitosheet, Bamboolib
Лекции:
Практика:
По заданному кейсу (файл .xlsx или .csv) создать несколько сводных таблиц, используя Google таблицы, применить методы создания и редактирования сводных таблиц, применить добавление и использование вычисляемых полей и визуализаций.
Выявить инсайты, по сводным таблицам создать простые визуализации, дополняющие инсайты. Научиться применять табличные процессоры (Google таблиц, Excel, МойОфис- таблиц) для маркетинговой аналитики Основы работы с Looker Studio. Tutorial: создание нового отчета:
  • создать новый пустой отчет

  • добавить еще одну диаграмму в отчет

  • стиль отчета

  • добавить баннер

  • добавить заголовок к отчету

Решение задач прогнозирования пропущенных значений, поиска аномальных значений, решения задач классификации и регрессии на других датасетах Очистка данных о валюте с помощью pandas:
  • импорт табличных данных .csv

  • проверка форматов и пропущенных значений

  • методы очистки табличных данных

Разбор галереи примеров библиотек визуализации данных Matplotlib, Seaborn, Altair, Plotly Express Обработка пропущенных значений/выбросов/дубликатов, изменение порядка, вычисляемые столбцы, переименование, удаление, сортировка, пользовательские функции, обработка даты и времени, сводные таблицы, визуальный анализ данных, проверка гипотез и построение начальных моделей Освоение основных приемов работы с библиотеками Python с визуальным интерфейсов программирования
Модуль 3
Машинное обучение на Python
16 практических заданий
36 часов
8 лекций
12 самостоятельных
Тема 3.1. Машинное обучение для решения задач Data Mining. Градиентный спуск в машинном обучении
Тема 3.2. Деревья решений. Бэггинг, бустинг, стекинг. Фреймворки машинного обучения
Тема 3.3. Введение в кластерный анализ, алгоритм k-means
Тема 3.4. Введение в нейронные сети, глубокие нейронные сети.
Лекции:
Практика:
Решение регрессионной задачи с помощью библиотеки scikit-learn. Импорт и загрузка датасета, создание и обучение моделей машинного обучения с помощью scikit-learn. Оценка признаков и моделей. Импорт и загрузка набора данных. Создание, обучение и сравнение ансамблей моделей машинного обучения с помощью scikit-learn. Методы бэггинга, бустинга
Решение задачи выявления неудовлетворенных потребностей клиентов путем их сегментации, решение задачи Credit Card Dataset for Clustering
Применение библиотек XGBoost, PyCaret, Prophet и глубоких нейронных сетей для прогнозирования временных рядов.
Модуль 4
Технологии формирования многомерной интерактивной
16 практических заданий
36 часов
8 лекций
12 самостоятельных
Тема 4.1. Аналитические технологии Loginom
Тема 4.2. Разработка дашбордов и проведение сторителлинга в Tableau Public
Тема 4.3. Разработка интерактивных отчетов в Power BI
Тема 4.4. Визуализация данных в Yandex DataLens
Лекции:
Практика:
Импорт данных и настройка форматов для работы в Loginom
Интерпретация результатов оценки качества данных
Применение OLAP-анализа и создание отчетов
Настройка параметров обучения моделей
Выполнение прогнозирования с использованием обученной модели
Изучить функционал Tableau
Произвести загрузку и подключение к данным
Произвести визуализацию данных
Подключение к данным в Power BI Desktop Трансформация данных: основные преобразования
Моделирование данных: Управление связями данных
Создание вычислимых столбцов
Создание вычислимых измерений
Использование вычисляемых таблиц
Разработка полноценного дашборда для мониторинга ключевых бизнес-метрик. Работа с разными источниками данных: подключение к своим облачным и локальным базам данных, сервисам и плоским файлам, комбинирование данных из разных источников в одном дашборде.
© ООО «Мобильное Электронное Образование», 2022−2023
Москва, ул. Сущевский Вал, 16с4
to@mob-edu.ru
8 800 770 75 08
Мы используем файлы cookie, для персонализации сервисов и повышения удобства пользования сайтом. Если вы не согласны на их использование, поменяйте настройки браузера.