DATA HACK
5 — 7
августа 2022
Oнлайн-хакатон от SENSE Group и Акселератора Возможностей при ИНТЦ МГУ «Воробьевы горы» при поддержке ГК «Иннотех»
Примите участие в трехдневном онлайн-хакатоне в области Big Data, выполните задание одного
из трех кейсов на выбор и станьте победителем!
Успей зарегистрироваться до 1 августа!
Кейсы
Статический анализатор SparkSQL
с возможностью добавления
пользовательских правил
#1
Генератор фейковых данных
для сложных запросов
#2
Создание прототипа ETL Движка
из Postgres, Oracle, ClickHouse
в HDFS на Spark
#3
#1
Описание: необходимо разработать статический анализатор SparkSQL кода. Грамматика должна расширяться через отдельный BNF файл (https://en.wikipedia.org/wiki/Backus–Naur_form). Есть возможность добавлять пользовательские проверки в коде. Есть ООП интерфейс для использования из кода. Инструмент должен быть быстрым и изолированным. Не использовать Spark сессию. Укладываться в SLA до 5 секунд на 10 запросов.
Призовой фонд: 100 000 рублей за 1 место
Стек решений: #Python 3.7+, #Библиотека Lark, #Любые необходимые библиотеки, которые не требуют интеграции с внешними системами и БД.
Статический анализатор SparkSQL с возможностью добавления пользовательских правил
Призовой фонд: 100 000 рублей за 1 место
Описание: есть набор dataclasses, описывающий имена таблиц, их столбцы и типы. Требуется генератор фейковых данных при заданном описании таблиц. Большое (100к+ строк на таблицу) количество данных может быть сгенерировано в разумные сроки (до 30 минут на 5 таблиц). Нужен ООП инструментарий, который может обернуть эти классы и настроить некоторые столбцы так, что таблицы будут джоиниться между собой. В определенных столбцах данные нужно генерить по маске (для прохождения where, и т. п.). Будет возможность использовать техники тест дизайна (частотное распределение, граничные значения, эквивалентное разбиение)
Стек решений: #Python 3.7+, #Библиотека Faker или любые другие необходимые библиотеки, не требующие интеграции с внешними системами и БД.
Генератор фейковых данных для сложных запросов
#2
#3
Описание: движок должен быть шаблонизирован через конфигурацию. Простой snapshot с возможностью обогатить техническими столбцами (load_ts, source_name). Инкрементная загрузка с использованием HWM (High WaterMark) или другим методом.
Призовой фонд: 100 000 рублей за 1 место
Стек решений: #Python 3.7+, #PySpark 2+, #Hadoop 2+, #Postgres, #Oracle, #ClickHouse (см Spark JDBC).
Создание прототипа ETL Движка из Postgres, Oracle, ClickHouse в HDFS на Spark
ВОЗМОЖНОСТИ
ТАЙМЛАЙН
Вы сможете получить квалифицированную помощь
и поддержку на любом этапе хакатона
Поддержка и менторство от ГК «Иннотех»
Для участия в хакатоне необходимо подробно заполнить анкету участника
Регистрация
[ до 1 августа 2022 23:59 ]
Призовой фонд
300 000 рублей, а также специальные призы и подарки от партнеров
Возможность внедрить свое решение в систему компании
Решите кейс и получите шанс протестировать своё решение в работающей системе
Мастер-классы от профессионалов
Во время хакатона вы сможете поучаствовать
в мастер-классах от представителей IT-компаний, выиграть памятные призы и получить уникальные знания
Хакатон
[ 5-7 августа 2022 ]
Три дня интенсивной работы вместе с экспертами ГК «Иннотех», а также нетворкинг и другие активности!
Demo-day
[ 7 августа 2022 ]
Стоп-кодинг, демо и защита проектов
Закрытие хакатона
[ 7 августа 2022 ]
Торжественное закрытие хакатона «Data Hack» и награждение победителей, которые разделят призовой фонд в размере 300 000 рублей!
ЭКСПЕРТЫ
Ведущий разработчик
ГК «Иннотех»
Ведущий разработчик
ГК «Иннотех»
Ведущий разработчик ГК «Иннотех»
Руководитель группы разработки ГК «Иннотех»
Александр Кузнецов
Антон Полеводин
Владислав Иванченко
Сергей Ондрин
Старший разработчик мобильных приложений, «BestDoctor»
Павел Плотников
Эксперт в области обеспечения качеством и автоматизации тестирования ПО, «DataArt»
Алексей Тараненко
Программный инженер, «Covalent»
Сергей Голицын
ЭКСПЕРТЫ
ПАРТНЕРЫ
Cовременная высокотехнологичная быстроразвивающаяся IТ-компания. С 2020 года мы разрабатываем инновационные решения для цифровизации бизнеса. ГК «Иннотех» выстраивает партнерские отношения с ведущими компаниями финансового сектора, предлагая им комплексные решения для фронт- и бэк-офисов, современные финтех-продукты, системы работы с большими данными. Кроме того, ГК «Иннотех» выполняет на заказ технологические проекты любой сложности, помогая своим клиентам на пути цифровой трансформации
ГК «Иннотех»
FAQ
Что такое хакатон?
Это командное соревнование для программистов, дизайнеров, менеджеров и аналитиков, которые в сжатые сроки решают технологическую задачу: разрабатывают прототип, содержащий основной функционал.
Какие требования к участникам хакатона?
Минимальные требования: в команде должно быть от 2 до 6 человек, а все участники должны быть старше 18 лет.
У меня нет команды. Что делать?
Зарегистрируйтесь и мы поможем вам найти команду. Для поиска команды вы можете самостоятельно воспользоваться каналом хакатона. Если возникнут трудности - не стесняйтесь писать организаторам в чат или на почту contact@ac-vo.ru.
Я не из Москвы. Могу ли я участвовать?
Конечно! Хакатон будет проходить в онлайн-формате, поэтому участвовать можно из любого города.
Что нужно для участия?
Минимальный набор для коммуникации – Telegram, Zoom.
Здесь нет моего вопроса. К кому обратиться?
По любым вопросам пишите нам на почту contact@ac-vo.ru или в общий канал хакатона в Telegram.
Заявка
*Необходимо заполнить каждому участнику команды
Есть команда* --->
Нет команды --->
Нажимая на кнопку, вы даете согласие на обработку персональных данных и соглашаетесь c политикой в отношении обработки персональных данных
Заявка
Есть команда* --->
Нет команды --->
Нажимая на кнопку, вы даете согласие на обработку персональных данных и соглашаетесь c политикой в отношении обработки персональных данных