Хранилище данных (Data Warehouse, DWH) — это централизованная база для хранения и анализа информации из разных источников: ERP, CRM, веб-сервисов, Excel-файлов и баз данных.
Цель DWH: объединить данные в единую структуру для отчетов, бизнес-аналитики и стратегических решений.
Основные преимущества:
Классическая архитектура DWH состоит из нескольких слоев:
| Слой | Описание | Примеры данных |
|---|---|---|
| Staging | Временное хранение сырых данных | ERP, CRM, файлы CSV |
| DWH Core | Основное хранилище, интегрированные данные | Транзакции, продажи, клиенты |
| Data Mart | Витрины для отдельных бизнес-направлений | Финансы, маркетинг, продажи |
Подходы к построению:
Пример: розничная сеть собирает данные о продажах, остатках и клиентской активности. DWH объединяет все данные в единую структуру, а аналитики строят отчеты и прогнозы для маркетинга и закупок.
Поток данных:
| Характеристика | DWH | Data Mart |
|---|---|---|
| Объем данных | Весь корпоративный | Подмножество, конкретная область |
| Цель | Центральное хранилище для всех данных | Быстрый доступ к специализированным данным |
| Пользователи | Руководство, аналитики | Отделы, отдельные команды |
| Гибкость | Средняя | Высокая |
| Историчность | Да | Часто ограничена |
DWH позволяет объединить разрозненные данные, обеспечить их целостность, хранить историю и строить точные отчеты.
DWH оптимизирован на чтение и аналитику, хранит исторические данные и объединяет источники, в отличие от OLTP-систем, которые работают с текущими транзакциями.
Когда отделу нужна отдельная витрина данных для быстрого доступа и анализа конкретной бизнес-области.