Развитие практик проектирования и создания систем, которые собирают, управляют, преобразуют и сохраняют данные в пригодном для использования состоянии и обеспечивают доступность для конечных потребителей данных.
Простыми словами разработка платформ и архитектур для обработки данных.
Работа с потоковыми данными и выстраивание процесса обработки данных онлайн. Написание моделей для ad-hoc анализа и предиктивного прогнозирования.
Опыт работы с базами данных SQL и NoSQL, а также с различными форматами данных и файлов (json, xml, csv и т.д.). Интеграционные решенияна основе различных API.
В своей работе используем современные походы и системы, например Airflow, Jupyter, Docker, gitlab, jenkins и т.д. Основные языки разработки T-SQl, Python с такими библиотеками, как: FastAPi, Polars, Pandas и т.д.