ModeratoR #2
Administrator
Ссылку на контент могут видеть только пользователь группы: VIP статус
Автор: Нетология Название: Профессия - Data Scientist (2019) Описание: Мощнейший курс по программированию от Нетологии. В сети были некоторые части материала, которые вызывали дикий восторг у людей. В этой раздаче находится весь материал. Data Scientist создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей, помогая бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы. Курс состоит из более чем 180 часов видео и домашних заданий от ведущих специалистов по Data Scientist компаний Mail.ru, Ivi и Avito. Первые два набора уже удачно состоялись, и студенты вовсю погрузсь в базовые алгоритмы ML, feature engineering, машинное зрение, Data Scientist в e-commerce, временные ряды и прогнозирование стоимости акций и других товаров. Их преподавателями стали эксперты из Yandex Data Factory, Rambler&Co, Сбербанк Технологии и теперь у вас появится возможность получить все необходимые знания и навыки для работы в области больших данных. Программа обучения: I Подготовительный блок: Экспресс-обучение основным инструментам: Python 3, git, библиотеки numpy, pandas. Обзор основного математического аппарата: матричные операции, введение в статистику и проверку гипотез. II Введение в data science, основные инструменты: Что такое data science, big data, как это работает и где применяется. Эксплоративный анализ и библиотеки визуализации данных. Обзор методов машинного обучения в бибилотеке scikit-learn. III Базовые алгоритмы и понятия машинного обучения: Разбор основных задач и алгоритмов машинного обучения: деревья решений, метод k ближайших соседей, линейный классификатор и логистическая регрессия, кластеризация. Проверка точности модели. Проблема переобучения и борьба с ней: регуляризация, ансамблирование. IV Feature engineering: Проблемы качества и размерности данных. Уменьшение размерности данных. Методы декомпозиции. Cпрямляющие пространства. V Рекомендательные системы: Введение в рекомендательные системы. Неперсонализированные рекомендации. Персонализированные рекомендации. Развитие рекомендательных систем. VI Распознавание изображений, машинное зрение: Базовая теория. Обзор кейсов применения. Нейросети. Разбор реальных задач: рукописный ввод, детекция и сегментация объектов на изображении. VII Обработка естественного языка (NLP): Введение в обработку текста. Обзор существующих библиотек, их использование и доработка. Использование внешних ресурсов. Грязные тексты: что это такое и как с ними работать. Дистрибутивная семантика. Чатботы: разбор генерации текстов. Нейросети для NLP. VIII Анализ временных рядов, прогнозирование: Временные ряды, модели ARMA/ARIMA. Сложные модели прогнозирования. Эксплоративный анализ временных рядов. IX Общение с заказчиком: Проекты машинного обучения: как выявить требования и оценить проект. Составление отчетов по исследованиям. Мастер-класс по презентации результатов. X Data Science в маркетинге и e-commerce: Цели, задачи, решения и критерии успешности применения Data Science. Маркетинг Data-Driven vs интуиция. Типы данных и примеры датасетов. Методы сбора из разных источников. Подготовка и обработка данных, извлечение смысла и визуализация. Разбор атрибуции маркетинговых расходов для увеличения дохода интернет-магазина. XI Дополнительные инструменты, среды: Экосистема Google: BigQuery, Dataflow, Dataproc, Datalab и др. Коммерческие решения HP: Vertica, Haven, IDOL, коннекторы данных. Решения от Amazon (AWS). Хранение и обработка данных в Clickhouse. XII Дипломная работа: Разработка и внедрение собственного ML-решения/проекта либо разработка предложенного нами кейса. Что вы получите в результате обучения Достигнутые результаты Построена полносвязная нейросеть Создан чат-бот для поиска авиабилетов Построен классификатор изображений Созданы рекомендательные системы для музыкального и киносайта Создан готовый к внедрению ml-проект Ключевые навыки Сбор и подготовка данных для анализа Создание нейросетей Генерация текстов и изображений Создание рекомендательных систем Выбор и реализация алгоритма под задачу Выбор и создание фич для модели Объем материала: ~ 165 GB |