Не трать время на визуальное программирование. Определяй все процессы ETL как код на декларативном языке. Пиши его в любимом редакторе, храни в репозитории, деплой через привычный CI
Документация* Адаптеры являются подключаемыми, и могут быть расширены через Java API
* Get On GitHubОперация Data Cooker — это как большая хранимая процедура, написанная на Java с использованием Spark RDD API. Низкоуровнево, и потому работает очень быстро.
Дата/время, геохешинг, вычисление рядов данных, популяционная статистика, геофенсинг, аналитика треков и плоскостных геометрий — 22 операции в стандартной поставке
Fork Me On GitHubПоддержка подключаемых трансформаций (как и операции, они написаны на Java) вкупе с объектно-ориентированным SELECT позволяет преобразовывать данные каждого из поддерживаемых форматов в любой другой.
В стандартной поставке — 21 трансформация
Fork Me On GitHub...итак, у нас были с собой пара десятков операций, примерно столько же трансформаций, горсть адаптеров хранилищ, и^W Упс, не тот жанр.
Что нам хочется донести: не хватает стандартных — напиши собственные. Код открыт, API простое. А документация по всем объектам, кстати, генерируется при сборке автоматически
Fork Me On GitHubПакетный локальный, Пакетный на кластере, Интерактивный локальный, Сервер на кластере, Интерактивный консольный клиент — и всё это с дополнительными опциями
Проще говоря, один FatJAR включает в себя всё, что необходимо для отладочного и промышленного окружения. А с учетом того, что сервер и клиент общаются через очень простой REST, интеграция в браузерный dashboard или notebook при необходимости реализуется легко
ОзнакомитьсяМы не против, если вы будете внедрять наш инструментарий самостоятельно, и/или создадите на его основе собственный продукт. На то Open Source и существует!
Но у нас есть многолетний опыт сопровождения серьёзного международного проекта географической аналитики, использующей Data Cooker ETL в облаке Amazon, и мы с большим удовольствием поделимся экспертизой, накопленной на десятках тысяч различных ETL процессов
Написать письмо Связаться в Telegram