Анклав, Enclave, TEE | Среда безопасной обработки данных, исполняющая пользовательские скрипты в защищенной среде с использованием технологии SGX |
Атрибут | Определяет бизнес-смысл характеристики некоторой сущности. В разрезе системы и датасетов является синонимом поля датасета. |
Атрибут матчинга | Характеристика поля датасета, указывающая на то что в поле хранится информация по которой возможно произвести матчинг датасета. |
Базовый датасет | Датасет принадлежащий инициатору процесса обмена данными, на основе которого создается сматченый датасет |
БД | База данных. Совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных |
Бизнес-термин | Это понятие, определенное внутри компании участника совместной обработки данных, которым пользователи оперируют в рамках осуществления своей деятельности, с целью достижения понимания значения поля / аттрибута датасета. |
БЧ, Блокчейн, Blockchain | Система распределенного реестра данных, доступная каждому участнику обмена данными, при наличии соответствующих ключей шифрования. |
Виртуальная машина , VM | Программная система, эмулирующая аппаратное обеспечение некоторой платформы, предназначенная для предоставления защищенного удаленного рабочего стола |
Внутренние ИС | Информационные системы принадлежащие компании участнику совместной обработки данных не сходящие в состав решений Vaultee |
Воркер | Постоянно запущенный программный компонент системы, постоянно (не по тригеру) выполняющий какое-либо действие. Прим: постоянно подключен к брокеру очереди и ожидает сообщения для исполнения. |
Вычисляемый атрибут | Атрибут, значение которого необходимо рассчитывать по некоторому алгоритму путем преобразования исходных данных (например, склонность к приобретению продукта А, признак состоятельности, маржинальная прибыль и т.п.). |
Глоссарий | Реляционная структура с описанием, предоставляющая информацию о том наборе данных, который имеется в компании. Глоссарий содержит совокупность сущностей с описанием, их атрибутов и связей между ними, а также дополнительной информации, которая позволяет объяснить назначение и контекст применения конкретного бизнес-термина или набора данных. |
Группа матчинга | Группа датасетов объединенная общими полями матчинга, предназначена для составления в конструкторе матчинга результирующего датасета. |
Датасет, НД, Наборы данных | Обработанная и структурированная информация в табличном виде |
Инстанс | Установленный в контуре партнера экземпляр системы |
Каноническая модель данных | Базовая модель данных к которой приводятся данные датасеты для соответствия требованиям и приобретения возможности осуществлять совместную обработку данных |
Кластер | Набор машин (серверов), так называемых нод, которые запускают контейнеризированные приложения. Кластер имеет как минимум один рабочий узел. |
Компания-провайдер | Компания участник обмена данными, предоставляющее данные для совместной обработки данных |
Компания-реквестор | Компания участник обмена данными, запрашивающее данные для совместной обработки данных |
Логирование | Это процесс записи информации о событиях, происходящих в рамках какого-либо процесса с некоторым объектом. Запись может проводиться в файл регистрации или в базу данных. |
Маркетплейс | Раздел, в котором представлены возможные для обработки датасеты, принадлежащие различным компаниям участникам обмена данными |
Матчинг | Процесс сопоставления двух и более датасетов по ряду сопоставляемых атрибутов матчинга |
Матчрейт | Количество строк двух и более датасетов который совпадают по ряду атрибутов матчинга, является аттрибутом результирующего датасета. |
Метаданные | Дополнительные данные описывающие различные дополнительные аттрибуты датасетов |
Модерация | Процесс согласования использования датасетов и/или скриптов |
Нода | Сервер добавленный в кластер |
Нотификации | Сообщения, оповещения отображающиеся в интерфейсе системы, оповещающие о важных событиях совершенных другими пользователями или участниками обмена данных |
Общий секрет | Это случайная последовательность байт, сгенерированная с помощью генератора псевдослучайных чисел SGX в TEE и хранящаяся в в его памяти. Пользователь, в том числе и привилегированный не имеет доступ к секрету. |
Партнер | Компания участник обмена данных |
Поды | Базовые строительные блоки Kubernetes. Pod представляет собой запрос на запуск одного или более контейнеров на одном узле. |
Поля матчинга | Поля датасета, которым присвоены атрибуты матчинга. |
Проект | Ключевая сущность в системе, объединяющая в себе согласованные группы матчинга, виртуальные машины, скрипты, модели CleanRoom, предназначенная для достижения конкретных бизнес целей. |
Публикация | Процессы приведения датасетов к соответствию с канонческой моделью, назначению датасетам и полям датасетов метаданных |
РД | Распорядитель данных - роль в системе |
режим Debug | Один из режимов запуска CleanRoom, в этом режиме система исполняет пользовательские скрипты, не давая компанию исполнителю скрипта конечного результата исполнения скрипта. Предназначается для выполнения отладки скрипта до того как скрипт будет отправлен на модерацию партнерам |
режим Prod | Один из режимов запуска CleanRoom, в этом режиме система исполняет пользовательские скрипты, предоставляя компании исполнителю результат исполнения. |
Скорбалл | Числовая оценка назначаемая клиентам по результатам исполнения модели в CleanRoom |
Сматченный датасет, результирующий датасет | Датасет полученный в результате матчинга двух и более датасетов |
Согласие | Атрибут матчинга, который присваивается полю датасета, обозначающий согласие клиента участника обмена данных на обработку персональных данных. |
Статичный атрибут | Атрибут, значение которого определено и не требует расчета (например, ФИО, адрес и т.п.) |
СУБД | Система управления базами данных. Комплекс программ, позволяющих создать базу данных и манипулировать данными (вставлять, обновлять, удалять и выбирать) |
ТСД | Технический стюард данных - роль пользователя в системе |
Apache Atlas | Это система управления и управления метаданными с открытым исходным кодом, необходимая для работы с метаданными датасетов |
Cleanroom | Это модуль DCP, который позволяет исполнять обученные ранее модели на основе данных одного и более Партнеров в безопасной среде. |
CleanRoom | Модуль решения DCP предназначенный для запуска моделей на общих данных партнеров в конфиденциальных средах |
Clickhouse (СН, КХ) | Это колоночная аналитическая СУБД с открытым кодом, позволяющая выполнять аналитические запросы в режиме реального времени на структурированных больших данных |
Customer Data Platform (CDP) | Решение для создания аудиторий на основе собственных и партнерских данных и запуска рекламных кампаний в различных каналах. |
Data Collaboration Platform (DCP) | Пакет решений для совместного моделирования и аналитики данных с использованием данных партнеров. |
DataLabs | Решение для аналитики и разработки моделей на основе деперсонализированных данных партнеров в специальной защищенной среде. |
ETL-процесс | Один из основных процессов в управлении хранилищами данных, который включает в себя: извлечение данных из внешних источников; их трансформация и очистка, чтобы они соответствовали потребностям бизнес-модели; и загрузка их в хранилище данных. |
IDE | Интегрированная среда разработки / единая среда разработки - комплекс программных средств, используемый программистами для разработки программного обеспечения |