Иван
Шамаев
Строю production-grade платформы данных и AI-агенты, которые приносят измеримый бизнес-результат. 15+ лет от BI-консалтинга до архитектуры DWH в e-commerce.
Инженер данных,
строящий AI-платформы
Senior Data Engineer с опытом 15+ лет в BI, хранилищах данных и прикладном AI. Сейчас — в Ozon Tech, разрабатываю batch-пайплайны на Vertica и Trino, проектирую DWH-домены и строю AI-агентов для автоматизации аналитических процессов.
Мой путь начинался с финансового консалтинга (SAS, Oracle Hyperion) и QlikView-разработки, прошёл через построение крупных BI-платформ на Qlik Sense и Apache Superset, а сегодня фокусируется на современном data-stack: dbt, Airflow, Trino, Iceberg, ClickHouse и практическом применении LLM в инженерии данных.
Data Engineering
Batch- и стриминговые пайплайны, архитектура DWH (Anchor Modeling), data quality, миграции, оптимизация затрат.
AI Agents
RAG-пайплайны, LLM-интеграция, агенты по базам знаний, SQL-копилоты, автоматизация на метаданных.
Технологический стек
Инструменты, с которыми работаю в инженерии данных, AI и инфраструктуре
15+ лет в данных
От финансового консалтинга и BI-платформ до DWH-архитектуры и AI-агентов
— настоящее время
- Спроектировал и разработал batch data pipelines на Vertica и Trino; построил витрины данных в DDS-слое по якорной модели
- Разработал MVP AI-агента по DWH — RAG-система с метаданными хранилища, связями таблиц и автогенерацией SQL; собрал RAG на внутренней базе знаний
- Создал ETL-monitoring dashboards в Grafana для контроля критических точек отказа и состояния пайплайнов
- Оптимизировал SQL-запросы и устранил статические дефекты Vertica; настроил параметры сессий Trino
- Провёл миграцию Vertica → Trino в рамках DWH-домена; ad-hoc выгрузки на PySpark + Hadoop
- Обучил коллег AI-инструментам (Continue plugin) и новым технологиям (Iceberg, Trino)
— Ноя 2024
- Курировал переезд с BigQuery на Yandex Cloud (ClickHouse, Airflow, dbt, AppMetrika, Yandex Metrika); обучил кросс-функциональные команды
- Провёл аудит BI-среды и устранил проблемы производительности DataLens (columnar-формат, отказ от views)
- Разработал дашборды для C-Level (метрики продаж, продуктовая аналитика); участвовал в OKR metric tree
- Стабилизировал DWH после ухода data engineers; нанял и onboard'ил новую команду
— Ноя 2023
- Внедрил Apache Superset с нуля — сократил расходы на Qlik-лицензии, расширил доступ к данным
- Разработал план-факт инструменты: 90% экономии времени на подготовку performance-отчётности
- Построил ETL из Facebook API (3 слоя в DataLake); автоматизировал финансовую отчётность (PnL, Balance Statement)
- Кастомные плагины Superset (React + TypeScript); GitLab CI для сборки Docker-образов; миграция 1.3.2 → 2.1.1
— Июл 2020
- Аналитика воронки продаж интернет-витрины; расчёт внутригрупповых операций в PnL; оценка маркетинговых акций
- PHP-экстрактор данных из API (Bitrix24 CRM, Yandex Metrika, Google Analytics, Mango Office)
- C# Windows Service для NPrinting API; .qvs-архитектура в GIT; апгрейды QV11→12, NP16→2020
- Грамота «Лучший сотрудник IV квартала 2019»
— Май 2017
- Проект внедрения системы бюджетирования на Hyperion Planning; развёртывание QlikView EPM для ERP GOLD
- Оптимизация интеграционных решений, постпроектная поддержка
— Ноя 2014
- Поддержка и развитие Oracle Hyperion Planning; аналитические модели данных в QlikView
— Авг 2013
- SAS Base, SAS FM, SAS ABM; консультирование клиентов, пресейлы; Oracle EPM, SAP BO PCM
— Сен 2011
- Поддержка системы Галактика, проектирование бизнес-процессов, написание ТЗ для разработчиков
Избранные кейсы
Результаты с измеримым бизнес-эффектом
Образование и развитие
Давайте
пообщаемся
Если есть вопросы по моему опыту или интересный проект — напишите удобным способом.