Skip to main content
Version: Next

Создание и публикация бизнес-терминов

Для того чтобы создать и опубликовать бизнес-термин, необходимо создать его в Каталоге данных.

Бизнес-термины необходимы для того чтобы:

  1. Давать возможность всем участникам обмена данных иметь четкое представление о том какие данные хранятся в каждом поле датасета

  2. Осуществлять управление доступностью отдельных полей, соответствующих бизнес-терминам, среди партнеров. Более подробно см. в разделе посвященному работе с датасасетами Создание и публикация датасетов

  3. Размечать атрибуты матчинга в датасетах для корректной работы алгоритма матчинга

Данные о бизнес-терминах возможно создавать в рамках платформы тремя методами:

  1. В интерфейсе Каталога данных

  2. С помощью загрузки из Excel-файла в Каталог данных

Бизнес-термин – это понятие, которым бизнес-пользователи оперируют в рамках осуществления своей деятельности, в том числе построения математических кросс-групповых моделей. Значение данного понятия является общепринятым внутри организации-владельца, что позволяет однозначно его интерпретировать. Различные термины могут обозначать одно и то же понятие, но только в том случае, если они определены как синонимы.

Виды бизнес-терминов:

  1. Сущность – определяет бизнес-смысл объекта, явления или процесса некоторой предметной области.
  2. Атрибут – определяет бизнес-смысл характеристики некоторой сущности. Атрибут, в свою очередь, может быть двух типов:
    1. Статичный – атрибут, значение которого определено и не требует расчета (например, ФИО, адрес и т.п.).
    2. Вычисляемый – атрибут, значение которого необходимо рассчитывать по некоторому алгоритму путем преобразования исходных данных (например, склонность к приобретению продукта А, признак состоятельности, маржинальная прибыль и т.п.).

Создание бизнес-терминов

В интерфейсе Каталога данных

  1. В левой части экрана выберите раздел "Каталог данных".

    Untitled

  2. Перейдите во вкладку "Бизнес-термины".

    Untitled

  3. Нажмите кнопку "+ Создать БТ"

    Untitled

  4. На вкладке "Описание термина" заполните поля в разделах "Обязательные", а также "Дополнительные", если необходимо.

  • Название термина
  • Описание термина
  • Тип термина:
    • Сущность - термин, описывает какую-то сущность
    • Статичный атрибут - термин, описывающий статичный атрибут
    • Расчетный атрибут - термин описывает расчетный атрибут, рекомендуется в описании указать порядок рассета.
  • Конфиденциальность - степень конфиденциальности термина и полей связанных с термином
  • Видимость - степень видимости термина для партнеров Untitled
  • Если термин является атрибутом матчинга, необходимо выбрать нужный атрибут из списка в разделе "Дополнительные".
  1. Если необходимо указать связи с другими терминами, перейдите на вкладку "Связи термина" (1 на рисунке ниже) и укажите необходимые значения.
  • Родительские термины - термины, являющиеся описанием более высокого уровня.
  • Дочерние термины - термины, сфомированные на основе указанного или являющиеся его частью.
  • Синонимы - равнозначные термины.
  1. Для завершения процесса создания бизнес-термина нажмите кнопку "Создать" (2 на рисунке ниже). Untitled

С помощью Excel-файлов

Бизнес-термины возможно создать с помощью экспорта Excel-Файла, в формате предоставленного шаблона.

Для этого необходимо:

  1. Создать бизнес-термин

  2. (Опционально) Указать синонимы бизнес-терминов, а также связь дочерних и родительских бизнес-терминов

    Далее в инструкциях описана загрузка каждой страницы отдельно, на практике, вы можете единожды заполнить все страницы Excel-файла и загрузить всю информацию единожды.

Шаблон файла для загузки

Создание и редактирование бизнес-терминов

  1. В шаблоне Excel-файла, на странице Бизнес-термин заполните поля соответствующие бизнес-термину и его классификациям:

    Наименование поляЗначение поляОбязательное полеВозможные значения
    Тип терминаОпределяет является ли термин сущностью или атрибутомда1 - Сущность 2, - Атрибут
    Тип атрибутаОпределяет какого типа атрибуттолько для атрибутов, если в типе термина указывается “1”1 - Статичный, 2 - Вычисляемый
    Наименование (Рус)Наименование термина на РусскомдаКлиент
    Наименование (Eng)Наименование термина на АнглийскомнетClient
    Организация-владелецНаименование организации-владельца терминанетVaultee
    Владелец данныхИмя ответственного за термин сотрудниканетИванов Сергей
    ОпределениеОпределение терминадаФизическое лицо совершавшее покупки
    Единица измеренияУказание единицы измерения, используется для обозначения единицы измерения вычисляемого атрибутанетКГ, шт и т.д.
    СтатусУказывает является ли термин используемым в компании на текущий моментда1 - Активен, 2 - Блокирован
    КонфиденциальностьОпределяет степень конфиденциальности термина и полей связанных с терминомда1 - «Доступно», 2 - «Конфиденциально», 3 - «Строго-конфиденциально»
    Область видимостиОпределяет степень видимости термина для партнеровда1 - Частные данные, 22 - Метаданные видимы только внутри экосистемы (группы компаний)
    Методика расчетаУказание того каким образом рассчитывается атрибутнетРасчет среднего чека за последние 3 календарных месяца
    Минимальный разрезСодержит наименьшую детализацию, в которой Партнер готов предоставлять данные Потребителю. Например: Дата-Объект-Товар, Месяц-Абонент и т.д.нет
    Методология агрегацииОсновывается на методологии расчета и содержит в себе агрегацию действий, которые применялись для расчета показателянет
    Атрибут матчингаУказание того является ли термин атрибутом матчинганет- first_name, - last_name, - patronymic, - birthday, - gender, - passport, - phone, - email, - agreement
danger

Перед практическим созданием термина рекомендуется изучить инструкции по публикации датасетов, поскольку атрибуты классификаций бизнес-терминов влияют на публикацию датасетов.

  1. В интерфейсе ADCP перейти в Каталог данных

  2. В верхнем правом углу нажать на кнопку загрузки.

    Untitled

  3. В открывшемся модальном окне нажать на кнопку “Загрузить”

    Untitled

  4. Выбрать на вашем локальном компьютере файл с заполненным шаблоном и загрузить его

  5. Дождаться завершения загрузки. В случае возникновения ошибок при загрузке файла с шаблоном есть возможность скачивания файла с ошибками, с помощью которого будет возможно определить место, в котором была допущена ошибка при заполнении

Создание связей бизнес-терминов между собой

В рамках платформы, для упрощения понимания смысла бизнес-термина и его значения датасаентистами других компаний, возможно указать бизнес-терминам синонимы, дочерние и родительские термины.

tip

Заполнение дочерних, родительских терминов и синонимов не влияет на публикацию

В интерфейсе Каталога данных

Назначение Синонимов

С помощью Excel-файлов

Синонимы

Для того чтобы указать синонимы, необходимо:

  1. В шаблоне Excel-файла, на странице Справочник синонимов (аналогов) заполнить поля, указав бизнес-термины, которые вы хотите связать:

    Наименование поляЗначение поляОбязательное полеВозможные значения
    ОрганизацияНаименование вашей организациинетVaultee
    Наименование Бизнес-терминаНаименование бизнес-термина на русском языкедаКлиент
    Наименование бизнес-термина аналогаНаименование бизнес-термина синонима на русском языкедаПокупатель
  2. Загрузить файл по аналогии с остальными

Родительские и дочерние термины

Для того чтобы связать 2 термина как родительский и дочерний, необходимо:

  1. В шаблоне Excel-файла, на странице Дочерние бизнес-термины заполнить поля, указав бизнес-термины, которые вы хотите связать:

    Наименование поляЗначение поляОбязательное полеВозможные значения
    ОрганизацияНаименование вашей организациинетVaultee
    Наименование Бизнес-терминаНаименование бизнес-термина на русском языкедаКлиент
    Наименование Бизнес-термина дочернегоНаименование бизнес-термина на русском языке, который является дочерним для бизнес-терминадаАктивный клиент
  2. Загрузить файл по аналогии с остальными

Предназначение полей матчинга

Как вы могли заметить, в каждом классификаторе Бизнес-терминов присутствует необязательное поле matching_attribute - поле матчинга.

Поля матчинга - поля, по которым можно объединять наборы данных локального партнера и внешних партнеров по данным (Более подробно про матчинг в разделе "Матчинг").

В наборах данных указываются ссылки на бизнес-термины, которые могут быть использованы в качестве полей матчинга. Это позволяет проводить автоматический матчинг различных наборов данных между собой. Наличие этих полей необходимо учитывать как при формировании датасета для загрузки в ClickHouse, так и при публикации датасетов. Более подробно о влиянии полей матчинга на публикацию датасетов возможно уточнить в разделе "Создание и публикация датасетов"

В системе предусмотренны следующие поля матчинга:

  1. last_name - фамилия клиента, которая представляет собой хэш от строки с солью, сформированной согласно договоренностям компаний.
  2. first_name - имя клиента, которое представляет собой хэш от строки с солью, сформированной согласно договоренностям компаний.
  3. patronymic - отчество клиента, которое представляет собой хэш от строки с солью, сформированной согласно договоренностям компаний.
  4. phone - номер мобильного телефона клиента, который представляет собой хэш от строки с солью, сформированной согласно договоренностям компаний. Номер телефона без +, без пробелов с кодом региона. Например, "79600667821".
  5. passport - серия и номер паспорта клиента, который представляет собой хэш от строки с солью, сформированной согласно договоренностям компаний.
  6. birthday - дата рождения клиента, которая представляет собой хэш даты рождения с солью, сформированной согласно договоренностям компаний.
  7. email - email клиента, который представляет собой хэш от строки с солью, сформированной согласно договоренностям компаний.
  8. gender - пол клиента, который представляет собой хэш от строки с возможными значениями “m/f” с солью, сформированной согласно договоренностям компаний.
  9. agreement - согласие клиента на обработку персональных данных, числовое значение 1 или 0, где 1 наличие согласия, 0 отсутствие согласия.