Dagster — это инструмент для организации процессов обработки данных, который предназначен для создания и управления конвейерами данных, включая ETL, тестирование, генерацию отчетов, обучение моделей машинного обучения и многое другое.
Этот оркестратор, основанный на языке программирования Python, обеспечивает простой способ для специалистов по обработке данных и инженеров проверять и отлаживать запуски, а также получать детальную информацию о ресурсах, метаданных и зависимостях в процессе выполнения.
Dagster позволяет создавать конвейеры для передачи данных между компонентами, повторно используемыми в логическом плане, а также проводить локальное тестирование и запуск в различных облачных сервисах, таких как AWS, GCP, Azure, или других распределенных системах.