Пример схемы компонентов
Мы обозначили, что возможны следующие элементы схемы:
- 4 типа компонентов (систем):
- Работающая система;
- Система еще не запущена в промышленную эксплуатацию;
- Система планируется к выводу из эксплуатации;
- Внешний источник данных.
2. 3 типа потоков данных:
- Текущий поток (AS IS)
- Планируемый поток (TO BE)
- Планируемый к удалению поток после внедрения потока TO BE;
3. Так как потоков оказалось довольно много, мы ввели обозначения потоков идентификаторами и свели их описание в отдельный документ.
Нужно понимать, что эта схема должна обновляться в режиме реального времени, иначе она быстро потеряет актуальность и практический смысл. Для этого мы определили ответственного за схему компонентов аналитика.
Настройка ETL процессов или “составление STTM модели”Для проектирования ETL процессов мы предпочли “подход от обратного”.
Мы зафиксировали список всех требуемых для отчетности KPI в отделе продаж компании, их получилось около 90. Затем шаг за шагом описывали, как формируется каждый KPI и из какой системы берутся данные.
Получившийся документ называется Source to target mapping или STTM модель. Это был огромный Excel. Наша схема компонентов AS IS помогла разобраться, как мы сможем построить потоки TO BE.
Мастер данные - основаМы сколько угодно можем настраивать потоки данных, но без “чистых” мастер данных мы не получим качественную отчетность, поэтому мы инициировали отдельный проект по работе и хранению мастер-данных.
Эта тема отдельной статьи, поэтому здесь только отобразим концептуальную схему, которую мы решили использовать к компании: все мастер-данные (как новые, так и обновляемые) сначала загружались в “стейджинг” и проверялись, и только потом загружались в мастер-каталог.