View on GitHub

DE or DIE

DE or DIE – митап, сделанный дата инженерами для дата инженеров.

DE or DIE #7

Дата мероприятия: 16.06.2021.
Формат мероприятия: online.

Доклады

Handling late data. How to make the right choice?

Автор: Дарья Буланова, Data Engineer, Dodo Engineering.

Материалы первого доклада:

О чем первый доклад

Сначала мы постараемся ответить на вопросы: а какие данные можно называть late? Все ли out-of-order считаются late? Какие есть способы обработки таких данных? Потом разберемся с тем, как различные паттерны обработки данных решают эту проблему.

Во второй части, посмотрим, на то, как с помощью различных движков добиться различных гарантий completeness. И в конце, на что опираться, когда вы принимаете решения, какой паттерн обработки данных выбрать.

Ingestion and historization in the Data Lake

Автор: Илья Тодор, Data Engineer, HRS Group, Certified AWS Cloud Practitioner.

Материалы второго доклада:

О чем второй доклад

Как мигрировать данные из одного источника в Data Lake, а затем в Data Warehouse с применением процесса хисторизации (SCD Type 2) на инфраструктурe AWS.

Вместе с Ильей мы посмотрим на живой кейс: на какие грабли можно наступить и каких успехов добиться в этом нелегком деле.