Создание и публикация бизнес-терминов
Для того чтобы создать и опубликовать бизнес-термин, необходимо создать его в Каталоге данных.
Бизнес-термины необходимы для того чтобы:
Давать возможность всем участникам обмена данных иметь четкое представление о том какие данные хранятся в каждом поле датасета
Осуществлять управление доступностью отдельных полей, соответствующих бизнес-терминам, среди партнеров. Более подробно см. в разделе посвященному работе с датасасетами Создание и публикация датасетов
Размечать атрибуты матчинга в датасетах для корректной работы алгоритма матчинга
Данные о бизнес-терминах возможно создавать в рамках платформы тремя методами:
В интерфейсе Каталога данных
С помощью загрузки из Excel-файла в Каталог данных
Бизнес-термин – это понятие, которым бизнес-пользователи оперируют в рамках осуществления своей деятельности, в том числе построения математических кросс-групповых моделей. Значение данного понятия является общепринятым внутри организации-владельца, что позволяет однозначно его интерпретировать. Различные термины могут обозначать одно и то же понятие, но только в том случае, если они определены как синонимы.
Виды бизнес-терминов:
- Сущность – определяет бизнес-смысл объекта, явления или процесса некоторой предметной области.
- Атрибут – определяет бизнес-смысл характеристики некоторой сущности. Атрибут, в свою очередь, может быть двух типов:
- Статичный – атрибут, значение которого определено и не требует расчета (например, ФИО, адрес и т.п.).
- Вычисляемый – атрибут, значение которого необходимо рассчитывать по некоторому алгоритму путем преобразования исходных данных (например, склонность к приобретению продукта А, признак состоятельности, маржинальная прибыль и т.п.).
Создание бизнес-терминов
В интерфейсе Каталога данных
В левой части экрана выберите раздел "Каталог данных".
Перейдите во вкладку "Бизнес-термины".
Нажмите кнопку "+ Создать БТ"
На вкладке "Описание термина" заполните поля в разделах "Обязательные", а также "Дополнительные", если необходимо.
- Название термина
- Описание термина
- Тип термина:
- Сущность - термин, описывает какую-то сущность
- Статичный атрибут - термин, описывающий статичный атрибут
- Расчетный атрибут - термин описывает расчетный атрибут, рекомендуется в описании указать порядок рассета.
- Конфиденциальность - степень конфиденциальности термина и полей связанных с термином
- Видимость - степень видимости термина для партнеров
- Если термин является атрибутом матчинга, необходимо выбрать нужный атрибут из списка в разделе "Дополнительные".
- Если необходимо указать связи с другими терминами, перейдите на вкладку "Связи термина" (1 на рисунке ниже) и укажите необходимые значения.
- Родительские термины - термины, являющиеся описанием более высокого уровня.
- Дочерние термины - термины, сфомированные на основе указанного или являющиеся его частью.
- Синонимы - равнозначные термины.
- Для завершения процесса создания бизнес-термина нажмите кнопку "Создать" (2 на рисунке ниже).
С помощью Excel-файлов
Бизнес-термины возможно создать с помощью экспорта Excel-Файла, в формате предоставленного шаблона.
Для этого необходимо:
Создать бизнес-термин
(Опционально) Указать синонимы бизнес-терминов, а также связь дочерних и родительских бизнес-терминов
Далее в инструкциях описана загрузка каждой страницы отдельно, на практике, вы можете единожды заполнить все страницы Excel-файла и загрузить всю информацию единожды.
Создание и редактирование бизнес-терминов
В шаблоне Excel-файла, на странице Бизнес-термин заполните поля соответствующие бизнес-термину и его классификациям:
Наименование поля Значение поля Обязательное поле Возможные значения Тип термина Определяет является ли термин сущностью или атрибутом да 1 - Сущность 2, - Атрибут Тип атрибута Определяет какого типа атрибут только для атрибутов, если в типе термина указывается “1” 1 - Статичный, 2 - Вычисляемый Наименование (Рус) Наименование термина на Русском да Клиент Наименование (Eng) Наименование термина на Английском нет Client Организация-владелец Наименование организации-владельца термина нет Vaultee Владелец данных Имя ответственного за термин сотрудника нет Иванов Сергей Определение Определение термина да Физическое лицо совершавшее покупки Единица измерения Указание единицы измерения, используется для обозначения единицы измерения вычисляемого атрибута нет КГ, шт и т.д. Статус Указывает является ли термин используемым в компании на текущий момент да 1 - Активен, 2 - Блокирован Конфиденциальность Определяет степень конфиденциальности термина и полей связанных с термином да 1 - «Доступно», 2 - «Конфиденциально», 3 - «Строго-конфиденциально» Область видимости Определяет степень видимости термина для партнеров да 1 - Частные данные, 22 - Метаданные видимы только внутри экосистемы (группы компаний) Методика расчета Указание того каким образом рассчитывается атрибут нет Расчет среднего чека за последние 3 календарных месяца Минимальный разрез Содержит наименьшую детализацию, в которой Партнер готов предоставлять данные Потребителю. Например: Дата-Объект-Товар, Месяц-Абонент и т.д. нет Методология агрегации Основывается на методологии расчета и содержит в себе агрегацию действий, которые применялись для расчета показателя нет Атрибут матчинга Указание того является ли термин атрибутом матчинга нет - first_name, - last_name, - patronymic, - birthday, - gender, - passport, - phone, - email, - agreement
Перед практическим созданием термина рекомендуется изучить инструкции по публикации датасетов, поскольку атрибуты классификаций бизнес-терминов влияют на публикацию датасетов.
В интерфейсе ADCP перейти в Каталог данных
В верхнем правом углу нажать на кнопку загрузки.
В открывшемся модальном окне нажать на кнопку “Загрузить”
Выбрать на вашем локальном компьютере файл с заполненным шаблоном и загрузить его
Дождаться завершения загрузки. В случае возникновения ошибок при загрузке файла с шаблоном есть возможность скачивания файла с ошибками, с помощью которого будет возможно определить место, в котором была допущена ошибка при заполнении
Создание связей бизнес-терминов между собой
В рамках платформы, для упрощения понимания смысла бизнес-термина и его значения датасаентистами других компаний, возможно указать бизнес-терминам синонимы, дочерние и родительские термины.
Заполнение дочерних, родительских терминов и синонимов не влияет на публикацию
В интерфейсе Каталога данных
Назначение Синонимов
С помощью Excel-файлов
Синонимы
Для того чтобы указать синонимы, необходимо:
В шаблоне Excel-файла, на странице Справочник синонимов (аналогов) заполнить поля, указав бизнес-термины, которые вы хотите связать:
Наименование поля Значение поля Обязательное поле Возможные значения Организация Наименование вашей организации нет Vaultee Наименование Бизнес-термина Наименование бизнес-термина на русском языке да Клиент Наименование бизнес-термина аналога Наименование бизнес-термина синонима на русском языке да Покупатель Загрузить файл по аналогии с остальными
Родительские и дочерние термины
Для того чтобы связать 2 термина как родительский и дочерний, необходимо:
В шаблоне Excel-файла, на странице Дочерние бизнес-термины заполнить поля, указав бизнес-термины, которые вы хотите связать:
Наименование поля Значение поля Обязательное поле Возможные значения Организация Наименование вашей организации нет Vaultee Наименование Бизнес-термина Наименование бизнес-термина на русском языке да Клиент Наименование Бизнес-термина дочернего Наименование бизнес-термина на русском языке, который является дочерним для бизнес-термина да Активный клиент Загрузить файл по аналогии с остальными
Предназначение полей матчинга
Как вы могли заметить, в каждом классификаторе Бизнес-терминов присутствует необязательное поле matching_attribute
- поле матчинга.
Поля матчинга - поля, по которым можно объединять наборы данных локального партнера и внешних партнеров по данным (Более подробно про матчинг в разделе "Матчинг").
В наборах данных указываются ссылки на бизнес-термины, которые могут быть использованы в качестве полей матчинга. Это позволяет проводить автоматический матчинг различных наборов данных между собой. Наличие этих полей необходимо учитывать как при формировании датасета для загрузки в ClickHouse, так и при публикации датасетов. Более подробно о влиянии полей матчинга на публикацию датасетов возможно уточнить в разделе "Создание и публикация датасетов"
В системе предусмотренны следующие поля матчинга:
last_name
- фамилия клиента, которая представляет собой хэш от строки с солью, сформированной согласно договоренностям компаний.first_name
- имя клиента, которое представляет собой хэш от строки с солью, сформированной согласно договоренностям компаний.patronymic
- отчество клиента, которое представляет собой хэш от строки с солью, сформированной согласно договоренностям компаний.phone
- номер мобильного телефона клиента, который представляет собой хэш от строки с солью, сформированной согласно договоренностям компаний. Номер телефона без +, без пробелов с кодом региона. Например, "79600667821".passport
- серия и номер паспорта клиента, который представляет собой хэш от строки с солью, сформированной согласно договоренностям компаний.birthday
- дата рождения клиента, которая представляет собой хэш даты рождения с солью, сформированной согласно договоренностям компаний.email
- email клиента, который представляет собой хэш от строки с солью, сформированной согласно договоренностям компаний.gender
- пол клиента, который представляет собой хэш от строки с возможными значениями “m/f” с солью, сформированной согласно договоренностям компаний.agreement
- согласие клиента на обработку персональных данных, числовое значение 1 или 0, где 1 наличие согласия, 0 отсутствие согласия.