View on GitHub

DE or DIE

DE or DIE – митап, сделанный дата инженерами для дата инженеров.

DE or DIE #3

Дата мероприятия: 16.07.2020.
Формат мероприятия: online.

Доклады

Разбор реального проекта: E2E пайплайн для прогнозирования закупок ингредиентов в пиццериях c помощью Spark Streaming

Авторы:
Ксения Томак, Дарья Буланова, Михаил Кумачев, Data Engineering Team, Dodo Pizza
Иван Трусов, Solutions Architect, Databricks

Материалы доклада:

О чем первый доклад

Dodo Pizza совместно с Databricks сделали проект по решению задачи прогнозирования закупок ингредиентов в пиццериях. В рамках проекта был разработан набор near real-time и batch пайплайнов для сбора данных из источника, загрузки их в Delta Lake и подготовки витрин для использования в машинном обучении.

В рамках нашего выступления мы подробно разберем каждый из этапов и уделим особое внимание подводным камням при реализации проекта.

Часть 1:

Часть 2:

Стек используемых технологий