Настройка режима обучения персонализации

Важно!

Начиная с 20 сентября 2023 г. вы не сможете создавать новые ресурсы Персонализатора. Служба Персонализатора отменяется 1 октября 2026 года.

Режим ученика формирует доверие к службе Персонализатора и ее способностям машинного обучения, а также гарантирует, что служба отправляет учебную информацию без риска для сетевого трафика.

Настройка режима области

  1. Войдите в портал Azure для ресурса персонализации.

  2. На странице "Настройка" на вкладке "Параметры модели" выберите режим ученика и нажмите кнопку "Сохранить".

Screenshot of configuring apprentice mode learning behavior in Azure portal

Изменения в существующем приложении

В существующем приложении не должно быть изменений, как оно выбирает действия для отображения или как приложение определяет значение, а также его вознаграждение. Единственным изменением в приложении может быть порядок действий, отправленных в API ранжирования Персонализатора. Действие, отображаемое в настоящее время приложением, отправляется как первое действие в списке действий. API ранжирования использует это первое действие для обучения модели персонализации.

Настройка приложения для вызова API ранжирования

Чтобы добавить в приложение персонализацию, необходимо вызвать API ранжирования и наград.

  1. Добавьте вызов ранжирования API после точки в существующей логике приложения, где определяется список действий и их функций. Первым действием в списке действий должно быть действие, выбранное существующей логикой.

  2. Настройте код, чтобы отобразить действие, связанное с идентификатором действия награды для ответа API ранжирования.

Настройка приложения для вызова API-интерфейса наград

Примечание.

Вызовы API вознаграждения не влияют на обучение в режиме ученика. Служба учится, сопоставляя текущую логику приложения или действия по умолчанию. Однако реализация вызовов вознаграждения на этом этапе помогает обеспечить плавный переход в онлайн режим позже с помощью простого переключателя на портале Azure. Кроме того, награды будут записаны в журнал, что позволяет проанализировать, насколько хорошо выполняется текущая логика и сколько вознаграждений получено.

  1. Используйте существующую бизнес-логику, чтобы вычислить вознаграждение отображаемого действия. Значение должно находиться в диапазоне от 0 до 1. Отправьте эту награду в персонализацию с помощью API-интерфейса наград. Значение наград не ожидается сразу, и его можно отложить на период времени, в зависимости от бизнес-логики.

  2. Если вы не вернете вознаграждение в течение настроенного времени ожидания, вместо него будет зарегистрировано вознаграждение по умолчанию.

Оценка режима области

На портал Azure на странице "Монитор" ресурса Персонализатора просмотрите производительность сопоставления.

Screenshot of reviewing evaluation of apprentice mode learning behavior in Azure portal

Режим ученика предоставляет следующие метрики оценки:

  • Базовый уровень — среднее вознаграждение: средние вознаграждения по умолчанию для приложения (базовый уровень).
  • Персонализатор — среднее вознаграждение: среднее из общего числа вознаграждений, которые потенциально мог бы получить Персонализатор.
  • Отношение достижений к 1000 последних событий: отношение "Базовый" и "Персонализатор" — нормализовано по тысяче последних событий.

Переключение режима работы в режим "в сети"

При определении персонализации в среднем в 75–85 % скользящего среднего модель готова к переключению в оперативный режим.

В портал Azure для ресурса Персонализатора на вкладке "Параметры модели" на вкладке "Параметры модели" выберите *Режим "Онлайн" и нажмите кнопку "Сохранить".

Нет необходимости вносить изменения в вызовы API ранжирования и награды.

Следующие шаги