Обновили наше бесплатное решение, которое в десятки раз ускоряет обработку данных

Пару лет назад мы разработали решение spark-greenplum connector. Это многофункциональный коннектор с поддержкой параллельных операций чтения/записи между Apache Spark и базой данных Greenplum. А сейчас обновили его и выложили в открытый доступ.


Решение spark-greenplum connector — это многофункциональный плагин для платформ обработки и анализа больших данных. Используя его, вместо встроенного в Apache Spark коннектора, дата-инженеры смогут увеличить скорость чтения и записи из и в базу данных Greenplum в десятки раз и быстро масштабировать количество подключаемых и обрабатываемых источников.

С помощью коннектора инженеры смогут настроить структурированный стриминг с использованием микропакетной обработки. Эта функциональность помогает получать оперативные обновления требуемых данных, что повышает скорость обработки практически до реального времени.

У spark-greenplum connector имеется ряд дополнительных возможностей. Например, использование анонимного блока или функции PL/pgSQL в качестве источника или поглотителя данных при операциях чтения и записи. Это позволяет делегировать часть обработки данных на сторону БД.

На его основе можно строить ETL-решения и анализировать данные in-memory. Он обладает высокой скоростью передачи данных, большой гибкостью в настройке, а также:

  • автоматически формирует схемы данных;

  • разбивает вычисления на параллельные независимые потоки;

  • и поддерживает push-down операторы.

Apache Spark и Greenplum — это популярные opensource-решения, которые используются в большинстве российских платформ по работе с большими данными. Поэтому разработка пригодится многим компаниям.

«В текущих условиях подобные решения, которые обеспечивают работу систем обработки больших данных, имеют импортозамещающее значение. Учитывая важность этого, мы решили выложить наш коннектор в открытый доступ — Тимур Хасанов, технический директор ITSumma».

Репозиторий доступен по ссылке: https://github.com/itsumma/spark-greenplum-connector

Дуглас Эдвардс
Мне повезёт: Исповедь сотрудника Google №59
1 690 ₽
Бестселлер
Новинка
Готовы обсудить проект?

Ответим на заявку в ближайшие 24 часа. А еще мы можем проконсультировать вас по телефону +7 800 555-91-99, электронной почте info@itsumma.ru или в Telegram-чате.

Свяжитесь со мной здесь
Свяжитесь со мной здесь
❗️Имя не может быть пустым
❗️Телефон не может быть пустым
❗️Email не может быть пустым