| Анклав, Enclave, TEE | Среда безопасной обработки данных, исполняющая пользовательские скрипты в защищенной среде с использованием технологии SGX |
| Атрибут | Определяет бизнес-смысл характеристики некоторой сущности. В разрезе системы и датасетов является синонимом поля датасета. |
| Атрибут матчинга | Характеристика поля датасета, указывающая на то что в поле хранится информация по которой возможно произвести матчинг датасета. |
| Базовый датасет | Датасет принадлежащий инициатору процесса обмена данными, на основе которого создается сматченый датасет |
| БД | База данных. Совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных |
| Бизнес-термин | Это понятие, определенное внутри компании участника совместной обработки данных, которым пользователи оперируют в рамках осуществления своей деятельности, с целью достижения понимания значения поля / аттрибута датасета. |
| БЧ, Блокчейн, Blockchain | Система распределенного реестра данных, доступная каждому участнику обмена данными, при наличии соответствующих ключей шифрования. |
| Виртуальная машина , VM | Программная система, эмулирующая аппаратное обеспечение некоторой платформы, предназначенная для предоставления защищенного удаленного рабочего стола |
| Внутренние ИС | Информационные системы принадлежащие компании участнику совместной обработки данных не сходящие в состав решений Vaultee |
| Воркер | Постоянно запущенный программный компонент системы, постоянно (не по тригеру) выполняющий какое-либо действие. Прим: постоянно подключен к брокеру очереди и ожидает сообщения для исполнения. |
| Вычисляемый атрибут | Атрибут, значение которого необходимо рассчитывать по некоторому алгоритму путем преобразования исходных данных (например, склонность к приобретению продукта А, признак состоятельности, маржинальная прибыль и т.п.). |
| Глоссарий | Реляционная структура с описанием, предоставляющая информацию о том наборе данных, который имеется в компании. Глоссарий содержит совокупность сущностей с описанием, их атрибутов и связей между ними, а также дополнительной информации, которая позволяет объяснить назначение и контекст применения конкретного бизнес-термина или набора данных. |
| Группа матчинга | Группа датасетов объединенная общими полями матчинга, предназначена для составления в конструкторе матчинга результирующего датасета. |
| Датасет, НД, Наборы данных | Обработанная и структурированная информация в табличном виде |
| Инстанс | Установленный в контуре партнера экземпляр системы |
| Каноническая модель данных | Базовая модель данных к которой приводятся данные датасеты для соответствия требованиям и приобретения возможности осуществлять совместную обработку данных |
| Кластер | Набор машин (серверов), так называемых нод, которые запускают контейнеризированные приложения. Кластер имеет как минимум один рабочий узел. |
| Компания-провайдер | Компания участник обмена данными, предоставляющее данные для совместной обработки данных |
| Компания-реквестор | Компания участник обмена данными, запрашивающее данные для совместной обработки данных |
| Логирование | Это процесс записи информации о событиях, происходящих в рамках какого-либо процесса с некоторым объектом. Запись может проводиться в файл регистрации или в базу данных. |
| Маркетплейс | Раздел, в котором представлены возможные для обработки датасеты, принадлежащие различным компаниям участникам обмена данными |
| Матчинг | Процесс сопоставления двух и более датасетов по ряду сопоставляемых атрибутов матчинга |
| Матчрейт | Количество строк двух и более датасетов который совпадают по ряду атрибутов матчинга, является аттрибутом результирующего датасета. |
| Метаданные | Дополнительные данные описывающие различные дополнительные аттрибуты датасетов |
| Модерация | Процесс согласования использования датасетов и/или скриптов |
| Нода | Сервер добавленный в кластер |
| Нотификации | Сообщения, оповещения отображающиеся в интерфейсе системы, оповещающие о важных событиях совершенных другими пользователями или участниками обмена данных |
| Общий секрет | Это случайная последовательность байт, сгенерированная с помощью генератора псевдослучайных чисел SGX в TEE и хранящаяся в в его памяти. Пользователь, в том числе и привилегированный не имеет доступ к секрету. |
| Партнер | Компания участник обмена данных |
| Поды | Базовые строительные блоки Kubernetes. Pod представляет собой запрос на запуск одного или более контейнеров на одном узле. |
| Поля матчинга | Поля датасета, которым присвоены атрибуты матчинга. |
| Проект | Ключевая сущность в системе, объединяющая в себе согласованные группы матчинга, виртуальные машины, скрипты, модели CleanRoom, предназначенная для достижения конкретных бизнес целей. |
| Публикация | Процессы приведения датасетов к соответствию с канонческой моделью, назначению датасетам и полям датасетов метаданных |
| РД | Распорядитель данных - роль в системе |
| режим Debug | Один из режимов запуска CleanRoom, в этом режиме система исполняет пользовательские скрипты, не давая компанию исполнителю скрипта конечного результата исполнения скрипта. Предназначается для выполнения отладки скрипта до того как скрипт будет отправлен на модерацию партнерам |
| режим Prod | Один из режимов запуска CleanRoom, в этом режиме система исполняет пользовательские скрипты, предоставляя компании исполнителю результат исполнения. |
| Скорбалл | Числовая оценка назначаемая клиентам по результатам исполнения модели в CleanRoom |
| Сматченный датасет, результирующий датасет | Датасет полученный в результате матчинга двух и более датасетов |
| Согласие | Атрибут матчинга, который присваивается полю датасета, обозначающий согласие клиента участника обмена данных на обработку персональных данных. |
| Статичный атрибут | Атрибут, значение которого определено и не требует расчета (например, ФИО, адрес и т.п.) |
| СУБД | Система управления базами данных. Комплекс программ, позволяющих создать базу данных и манипулировать данными (вставлять, обновлять, удалять и выбирать) |
| ТСД | Технический стюард данных - роль пользователя в системе |
| Apache Atlas | Это система управления и управления метаданными с открытым исходным кодом, необходимая для работы с метаданными датасетов |
| Cleanroom | Это модуль DCP, который позволяет исполнять обученные ранее модели на основе данных одного и более Партнеров в безопасной среде. |
| CleanRoom | Модуль решения DCP предназначенный для запуска моделей на общих данных партнеров в конфиденциальных средах |
| Clickhouse (СН, КХ) | Это колоночная аналитическая СУБД с открытым кодом, позволяющая выполнять аналитические запросы в режиме реального времени на структурированных больших данных |
| Customer Data Platform (CDP) | Решение для создания аудиторий на основе собственных и партнерских данных и запуска рекламных кампаний в различных каналах. |
| Data Collaboration Platform (DCP) | Пакет решений для совместного моделирования и аналитики данных с использованием данных партнеров. |
| DataLabs | Решение для аналитики и разработки моделей на основе деперсонализированных данных партнеров в специальной защищенной среде. |
| ETL-процесс | Один из основных процессов в управлении хранилищами данных, который включает в себя: извлечение данных из внешних источников; их трансформация и очистка, чтобы они соответствовали потребностям бизнес-модели; и загрузка их в хранилище данных. |
| IDE | Интегрированная среда разработки / единая среда разработки - комплекс программных средств, используемый программистами для разработки программного обеспечения |