В мире больших данных

От идеи до таблицы: моделирование данных шаг за шагом

Моделирование выходит далеко за рамки таблиц и баз данных. Оно не только помогает разработчикам понять бизнес, но и помогает бизнесу понять себя.

Классически моделирование делится на три этапа:
— концептуальное
— логическое
— физическое

В этой заметке кратко раскроем каждое понятие, а затем в отдельных статьях поговорим про каждый этап подробнее.

Концептуальное моделирование

Это самый абстрактный этап. Он помогает понять, что именно нужно бизнесу. Здесь важна общая картина, а не детали. Представьте, что вы описываете свою компанию другу. Вы говорите о том, что у компании есть клиенты, товары и заказы. Но при этом не уточняете, как именно всё работает.

Концептуальное моделирование помогает всем в компании говорить на одном языке. Бизнес определяет ключевые сущности и связи между ними, архитекторы и/или аналитики создают простую диаграмму для наглядности. Это позволяет всем участникам проекта видеть общую картину.

Логическое моделирование

На этом этапе мы начинаем погружаться в детали, и уточняем все атрибуты и связи. Например, то, что у товара есть название, цена, размер и количество.

Логическое моделирование делает данные и их взаимосвязи понятными для всех участников. Бизнес подробно описывает сущности и процессы более детально, а аналитики конкретизируют эти данные и их связи.

Физическое моделирование

Наконец, заключительный этап — здесь логическая модель преобразуется в конкретное представление для выбранной СУБД. На этом этапе решаются вопросы, как именно данные будут организованы и управляться в выбранной базе данных.

Физическое моделирование включает:
— определение таблиц, столбцов и типов данных
— разработка индексов и партиционирования (при необходимости) для оптимизации производительности
— определение первичных и внешних ключей для обеспечения целостности данных
— прочие технические тонкости, включая data quality

Если коротко:
— Концептуальное моделирование: определяем ключевые сущности и их связи.
— Логическое моделирование: детализируем атрибуты и связи, уточняем типы данных.
— Физическое моделирование: подготавливаем всю техничку для создания в конкретной СУБД.

Зная об этих этапах, становится ясно, как данные проходят путь от абстрактных понятий, до конкретной реализации в базе данных. В итоге хранилище соответствует бизнесу и работает эффективно.

Но нужно понимать, что моделирование — это не событие, а процесс и он продолжается вместе с развитием компании.

#dwh

❤1

134 views15:54