Top.Mail.Ru

Samsung Innovation Campus

В преддверии хакатона IT Academy Hack 2025, мы начинаем лекции и мастер-классы по Большим данным и AI!

Сегодня вам предлагается ознакомиться с первой лекцией. Павел Кутаков, архитектор облачных решений компании VK Tech, познакомит вас с историей развития систем хранения данных.
Смотрите лекцию и задавайте вопросы в комментариях к видео,
Павел постарается на них оперативно ответить:

Вторая лекция мастер-классов развивает тему первой и знакомит вас с современным инструментарием работы с большими объемами данных. Его зовут Trino, именно с ним вам предстоит работать над заданием от VK Tech. Trino, как промежуточное звено, связывает источник данных с потребителем. Он позволяет перестроить привычные SQL запросы на новый лад, оптимизируя их с учетом текущей конфигурации хранилища данных.

Третья лекция раскрывает тему: генерация датасетов и их применение в задачах Big Data. Лектор: Дмитрий Яценко, главный инженер учебного центра Arenadata, преподаватель ЮФУ, МФТИ и Центрального университета.

На занятии рассмотрена задача генерации наборов данных и их применение в разнообразных задачах обработки информации. Вы узнаете, как наборы данных используются для обучения алгоритмов, анализа и валидации данных, а также для решения прикладных задач в области Big Data. Примеры известных наборов, таких как AdventureWorksDW, TPC, OpenCelliD и другие, помогут вам лучше понять практические аспекты работы с данными и адаптацию их под конкретные задачи.

Второй мастер-класс Дмитрия Яценко посвящен практическому примеру генерации синтетических данных.

В ходе мероприятия Дмитрий продемонстрировал примеры применения аналитических инструментов для сбора, обработки и генерации данных. Вы узнаете, как современные технологии и инструменты аналитики способствуют повышению качества данных, улучшению бизнес-процессов и принятию обоснованных решений в условиях динамично меняющейся информационной среды.

Зарегистрироваться на хакатон: здесь

Поделиться: