Перейти к основному содержимому
Версия: Next

Глоссарий

Термин Определение
Анклав, Enclave, TEEСреда безопасной обработки данных, исполняющая пользовательские скрипты в защищенной среде с использованием технологии SGX
АтрибутОпределяет бизнес-смысл характеристики некоторой сущности. В разрезе системы и датасетов является синонимом поля датасета.
Атрибут матчингаХарактеристика поля датасета, указывающая на то что в поле хранится информация по которой возможно произвести матчинг датасета.
Базовый датасетДатасет принадлежащий инициатору процесса обмена данными, на основе которого создается сматченый датасет
БДБаза данных. Совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных
Бизнес-терминЭто понятие, определенное внутри компании участника совместной обработки данных, которым пользователи оперируют в рамках осуществления своей деятельности, с целью достижения понимания значения поля / аттрибута датасета.
БЧ, Блокчейн, BlockchainСистема распределенного реестра данных, доступная каждому участнику обмена данными, при наличии соответствующих ключей шифрования.
Виртуальная машина , VMПрограммная система, эмулирующая аппаратное обеспечение некоторой платформы, предназначенная для предоставления защищенного удаленного рабочего стола
Внутренние ИСИнформационные системы принадлежащие компании участнику совместной обработки данных не сходящие в состав решений Vaultee
ВоркерПостоянно запущенный программный компонент системы, постоянно (не по тригеру) выполняющий какое-либо действие. Прим: постоянно подключен к брокеру очереди и ожидает сообщения для исполнения.
Вычисляемый атрибутАтрибут, значение которого необходимо рассчитывать по некоторому алгоритму путем преобразования исходных данных (например, склонность к приобретению продукта А, признак состоятельности, маржинальная прибыль и т.п.).
ГлоссарийРеляционная структура с описанием, предоставляющая информацию о том наборе данных, который имеется в компании. Глоссарий содержит совокупность сущностей с описанием, их атрибутов и связей между ними, а также дополнительной информации, которая позволяет объяснить назначение и контекст применения конкретного бизнес-термина или набора данных.
Группа матчингаГруппа датасетов объединенная общими полями матчинга, предназначена для составления в конструкторе матчинга результирующего датасета.
Датасет, НД, Наборы данныхОбработанная и структурированная информация в табличном виде
ИнстансУстановленный в контуре партнера экземпляр системы
Каноническая модель данныхБазовая модель данных к которой приводятся данные датасеты для соответствия требованиям и приобретения возможности осуществлять совместную обработку данных
КластерНабор машин (серверов), так называемых нод, которые запускают контейнеризированные приложения. Кластер имеет как минимум один рабочий узел.
Компания-провайдерКомпания участник обмена данными, предоставляющее данные для совместной обработки данных
Компания-реквесторКомпания участник обмена данными, запрашивающее данные для совместной обработки данных
ЛогированиеЭто процесс записи информации о событиях, происходящих в рамках какого-либо процесса с некоторым объектом. Запись может проводиться в файл регистрации или в базу данных.
МаркетплейсРаздел, в котором представлены возможные для обработки датасеты, принадлежащие различным компаниям участникам обмена данными
МатчингПроцесс сопоставления двух и более датасетов по ряду сопоставляемых атрибутов матчинга
МатчрейтКоличество строк двух и более датасетов который совпадают по ряду атрибутов матчинга, является аттрибутом результирующего датасета.
МетаданныеДополнительные данные описывающие различные дополнительные аттрибуты датасетов
МодерацияПроцесс согласования использования датасетов и/или скриптов
НодаСервер добавленный в кластер
НотификацииСообщения, оповещения отображающиеся в интерфейсе системы, оповещающие о важных событиях совершенных другими пользователями или участниками обмена данных
Общий секретЭто случайная последовательность байт, сгенерированная с помощью генератора псевдослучайных чисел SGX в TEE и хранящаяся в в его памяти. Пользователь, в том числе и привилегированный не имеет доступ к секрету.
ПартнерКомпания участник обмена данных
ПодыБазовые строительные блоки Kubernetes. Pod представляет собой запрос на запуск одного или более контейнеров на одном узле.
Поля матчингаПоля датасета, которым присвоены атрибуты матчинга.
ПроектКлючевая сущность в системе, объединяющая в себе согласованные группы матчинга, виртуальные машины, скрипты, модели CleanRoom, предназначенная для достижения конкретных бизнес целей.
ПубликацияПроцессы приведения датасетов к соответствию с канонческой моделью, назначению датасетам и полям датасетов метаданных
РДРаспорядитель данных - роль в системе
режим DebugОдин из режимов запуска CleanRoom, в этом режиме система исполняет пользовательские скрипты, не давая компанию исполнителю скрипта конечного результата исполнения скрипта. Предназначается для выполнения отладки скрипта до того как скрипт будет отправлен на модерацию партнерам
режим ProdОдин из режимов запуска CleanRoom, в этом режиме система исполняет пользовательские скрипты, предоставляя компании исполнителю результат исполнения.
СкорбаллЧисловая оценка назначаемая клиентам по результатам исполнения модели в CleanRoom
Сматченный датасет, результирующий датасетДатасет полученный в результате матчинга двух и более датасетов
СогласиеАтрибут матчинга, который присваивается полю датасета, обозначающий согласие клиента участника обмена данных на обработку персональных данных.
Статичный атрибутАтрибут, значение которого определено и не требует расчета (например, ФИО, адрес и т.п.)
СУБДСистема управления базами данных. Комплекс программ, позволяющих создать базу данных и манипулировать данными (вставлять, обновлять, удалять и выбирать)
ТСДТехнический стюард данных - роль пользователя в системе
Apache AtlasЭто система управления и управления метаданными с открытым исходным кодом, необходимая для работы с метаданными датасетов
CleanroomЭто модуль DCP, который позволяет исполнять обученные ранее модели на основе данных одного и более Партнеров в безопасной среде.
CleanRoomМодуль решения DCP предназначенный для запуска моделей на общих данных партнеров в конфиденциальных средах
Clickhouse (СН, КХ)Это колоночная аналитическая СУБД с открытым кодом, позволяющая выполнять аналитические запросы в режиме реального времени на структурированных больших данных
Customer Data Platform (CDP)Решение для создания аудиторий на основе собственных и партнерских данных и запуска рекламных кампаний в различных каналах.
Data Collaboration Platform (DCP)Пакет решений для совместного моделирования и аналитики данных с использованием данных партнеров.
DataLabsРешение для аналитики и разработки моделей на основе деперсонализированных данных партнеров в специальной защищенной среде.
ETL-процессОдин из основных процессов в управлении хранилищами данных, который включает в себя: извлечение данных из внешних источников; их трансформация и очистка, чтобы они соответствовали потребностям бизнес-модели; и загрузка их в хранилище данных.
IDEИнтегрированная среда разработки / единая среда разработки - комплекс программных средств, используемый программистами для разработки программного обеспечения