Konfigurowanie zachowania uczenia usługi Personalizacja

Ważne

Od 20 września 2023 r. nie będzie można tworzyć nowych zasobów usługi Personalizacja. Usługa Personalizacja jest wycofywana 1 października 2026 r.

Tryb praktykanta zapewnia zaufanie do usługi Personalizacja i jej możliwości uczenia maszynowego oraz zapewnia pewność, że usługa jest wysyłana z informacji, które można wyciągnąć z — bez ryzyka ruchu online.

Konfigurowanie trybu ucznia

  1. Zaloguj się do witryny Azure Portal, aby uzyskać zasób personalizacji.

  2. Na stronie Konfiguracja na karcie Ustawienia modelu wybierz pozycję Tryb praktykanta, a następnie wybierz pozycję Zapisz.

Screenshot of configuring apprentice mode learning behavior in Azure portal

Zmiany w istniejącej aplikacji

Istniejąca aplikacja nie powinna zmieniać sposobu, w jaki aktualnie wybiera akcje do wyświetlenia lub jak aplikacja określa wartość, nagrodę tej akcji. Jedyną zmianą w aplikacji może być kolejność akcji wysyłanych do interfejsu API rangi usługi Personalizacja. Akcja wyświetlana obecnie przez aplikację jest wysyłana jako pierwsza akcja na liście akcji . Interfejs API rangi używa tej pierwszej akcji do trenowania modelu personalizacji.

Konfigurowanie aplikacji w celu wywołania interfejsu API rangi

Aby dodać usługę Personalizacja do aplikacji, musisz wywołać interfejsy API Rank and Reward.

  1. Dodaj wywołanie interfejsu API rangi po punkcie w istniejącej logice aplikacji, w której określasz listę akcji i ich funkcji. Pierwsza akcja na liście akcji musi być akcją wybraną przez istniejącą logikę.

  2. Skonfiguruj kod, aby wyświetlić akcję skojarzoną z identyfikatorem akcji reward odpowiedzi interfejsu API rangi.

Konfigurowanie aplikacji w celu wywoływania interfejsu API programu Reward

Uwaga

Wywołania interfejsu API programu Reward nie mają wpływu na szkolenie w trybie praktykanta. Usługa uczy się, pasując do bieżącej logiki aplikacji lub akcji domyślnych. Jednak implementacja wywołań reward na tym etapie pomaga zapewnić bezproblemowe przejście do trybu online później przy użyciu prostego przełącznika w witrynie Azure Portal. Ponadto nagrody będą rejestrowane, umożliwiając analizowanie, jak dobrze działa bieżąca logika i ile nagród otrzymujesz.

  1. Użyj istniejącej logiki biznesowej, aby obliczyć nagrodę wyświetlanej akcji. Wartość musi znajdować się w zakresie od 0 do 1. Wyślij tę nagrodę do usługi Personalizacja przy użyciu interfejsu API programu Reward. Wartość nagrody nie jest oczekiwana natychmiast i może być opóźniona w danym okresie — w zależności od logiki biznesowej.

  2. Jeśli nie zwrócisz nagrody w skonfigurowanym czasie oczekiwania na nagrodę, zamiast tego zostanie zarejestrowana domyślna nagroda.

Ocena trybu ucznia

W witrynie Azure Portal na stronie Monitorowanie zasobu usługi Personalizacja zapoznaj się z tematem Dopasowywanie wydajności.

Screenshot of reviewing evaluation of apprentice mode learning behavior in Azure portal

Tryb ucznia udostępnia następujące metryki oceny:

  • Plan bazowy — średnia nagroda: średnie nagrody domyślne (punkt odniesienia) aplikacji.
  • Personalizator — średnia nagroda: Średnia łączna liczba nagród Personalizacja potencjalnie osiągnęłaby wartość.
  • Współczynnik osiągnięć nagród w ostatnich 1000 wydarzeniach: współczynnik nagrody wg planu bazowego i personalizacji — znormalizowany w ciągu ostatnich 1000 wydarzeń.

Przełączanie zachowania do trybu online

Po ustaleniu, że usługa Personalizacja jest trenowana ze średnią 75–85% średnią kroczącą, model jest gotowy do przełączenia się do trybu online.

W witrynie Azure Portal dla zasobu usługi Personalizacja na stronie Konfiguracja na karcie Ustawienia modelu wybierz pozycję *Tryb online, a następnie wybierz pozycję Zapisz.

Nie trzeba wprowadzać żadnych zmian w wywołaniach interfejsu API rangi i nagrody.

Następne kroki