Skip to main content
Version: Next

Выгрузка

  1. В проекте отображаются все группы матчинга и одиночные датасеты (далее - Набор данных), привязанные к нему.

Для того чтобы выгрузить данные на виртуальную машину, необходимо согласовать запросы на датасеты в этой группе. Согласование проводят владельцы датасетов. Подробнее процесс описан в подразделе Одобрение запроса на данные . После одобрения заявки владельцем данных, организации, которая запрашивала данные, придет письмо на почту с информацией, что заявка одобрена и можно приступать к дальнейшей работе с данными.

note

Каждый из владельцев данных, используемых в группе, должен на своем инстансе одобрить запросы на данные в разделе “Запросы:Входящие”.

  1. Для дальнейшей работы с данными откройте проект.

  2. Для этого перейдите в раздел "DataLab" и нажмите на название нужного проекта.

  3. На странице Данные вы увидите, что у одобренных наборов данных будет статус:

    1. в случае витрины "Согласована"Untitled
    2. в случае витрины "Одобрен"Untitled
  4. Добавьте необходимое количество виртуальных машин (VM) в проект с помощью кнопки "Добавить VM". Укажите название для каждой VM.

    Untitled

  5. Заполненные данные сохраняются автоматически.

  6. Убедитесь, что есть хотя бы один набор данных в подходящем для выгрузки статусе.

  7. Нажмите на кнопку "Запустить VM".

    Untitled

note

Одновременно может быть запущено ограниченное количество VM. Параметр задается в конфигурации инстанса. Если параметр не задан, то будет установлен дефолтный лимит в 10 VM.

  1. Нажмите на кнопку "Выгрузить данные". Кнопка отображается активной при наличии запущенной виртуальной машины и набора данных в подходящем для загрузки статусе.

Untitled

Во всплывающем окне вы увидите список наборов данных в подходящем для выгрузки статусе, которые можно выгрузить на виртуальные машины, и настройки для выгрузки.

note

В случае, если витрина была одобрена, но произошли критические изменения с входящими в состав витрины датасетами, то выгрузка будет недоступна.

К критическим изменениям относятся:

  • действия, приведшие к пометке датасета неопубликованным;

  • действия, приведшие к отсутствию обязательных матчинг атрибутов в одном из датасетов: отвязан бизнес-термин, удалено поле, изменены правила матчинга партнеров.

На выгрузку витрины могут повлиять изменения структуры датасета, которые привели к недоступности запрошенных полей. Например, удален или изменен тип одного из столбцов датасета.

  1. Для каждого набора данных укажите, на какие виртуальные машины его необходимо выгрузить. Для этого выберите в выпадающем списке одну из виртуальных машин (черная стрелка на рисунке ниже). К выбору доступны только виртуальные машины в статусе "Запущена".

  2. Нажмите кнопку "Выгрузить данные" (зеленая стрелка на рисунке ниже).

    Untitled

note

При выгрузке данных на VM алгоритм матчинга запускается заново, чтобы избежать загрузки не актуальных данных на VM.

Более подробное описание алгоритма матчинга описано в разделе Матчинг

  1. При необходимости вы можете остановить выгрузку набора данных на виртуальную машину.

    1. Для этого в разделе “VM” выберите нужный набор данных, который находится в статусе “Обработка”,

    2. Кликните на иконку “Стоп” рядом с ним.

      Untitled

Если набор данных не была выгружен на виртуальную машину, то задачу на выгрузку можно будет повторить. В противном случае выгрузка будет недоступна.

  1. Для того чтобы перейти на виртуальную машину, нажмите на иконку “Компьютер”.

    Untitled

note

Конфигурация среды DataLab обеспечивает безопасность при работе с данными:

  • в DataLab загружаются только преобразованные данные без возможности их восстановления до исходных,
  • из DataLab невозможна выгрузка данных и результатов их обработки,
  • DataLab обеспечивает только временное хранение данных в рамках жизни виртуальной машины и работы пользователя, и не поддерживает постоянное хранение данных

С более подробной информацией об управлении виртуальными машинами, работе на виртуальных машинах и их статусах вы можете познакомиться в разделе Запуск и управление VM