Het leergedrag van Personalizer configureren

Belangrijk

Vanaf 20 september 2023 kunt u geen nieuwe Personalizer-resources maken. De Personalizer-service wordt op 1 oktober 2026 buiten gebruik gesteld.

De apprentice-modus geeft u vertrouwen en vertrouwen in de Personalizer-service en de mogelijkheden voor machine learning, en biedt zekerheid dat de service informatie ontvangt die kan worden geleerd van – zonder risico's voor onlineverkeer.

Apprentice-modus configureren

  1. Meld u aan bij Azure Portal voor uw Personalizer-resource.

  2. Selecteer op de pagina Setup op het tabblad Modelinstellingen de modus Apprentice en selecteer Opslaan.

Screenshot of configuring apprentice mode learning behavior in Azure portal

Wijzigingen in de bestaande toepassing

Uw bestaande toepassing mag niet wijzigen hoe deze momenteel acties selecteert om weer te geven of hoe de toepassing de waarde, beloning van die actie bepaalt. De enige wijziging in de toepassing is mogelijk de volgorde van de acties die naar de Personalizer Rank-API worden verzonden. De actie die uw toepassing momenteel weergeeft, wordt verzonden als de eerste actie in de actielijst. De Rank-API gebruikt deze eerste actie om uw Personalizer-model te trainen.

Uw toepassing configureren om de Rank-API aan te roepen

Als u Personalizer wilt toevoegen aan uw toepassing, moet u de Rank- en Reward-API's aanroepen.

  1. Voeg de Rank API-aanroep toe na het punt in uw bestaande toepassingslogica, waar u de lijst met acties en hun functies bepaalt. De eerste actie in de lijst met acties moet de actie zijn die door uw bestaande logica is geselecteerd.

  2. Configureer uw code om de actie weer te geven die is gekoppeld aan de beloningsactie-id van het Rank API-antwoord.

Uw toepassing configureren om reward-API aan te roepen

Notitie

Reward-API-aanroepen hebben geen invloed op training in de app-modus. De service leert door de huidige logica of standaardacties van uw toepassing te vergelijken. Het implementeren van Reward-aanroepen in deze fase zorgt er echter voor dat de onlinemodus soepel verloopt met een eenvoudige switch in Azure Portal. Daarnaast worden de beloningen geregistreerd, zodat u kunt analyseren hoe goed de huidige logica presteert en hoeveel beloning er wordt ontvangen.

  1. Gebruik uw bestaande bedrijfslogica om de beloning van de weergegeven actie te berekenen. De waarde moet tussen 0 en 1 liggen. Verzend deze beloning naar Personalizer met behulp van de Reward-API. De beloningswaarde wordt niet onmiddellijk verwacht en kan gedurende een bepaalde periode worden vertraagd, afhankelijk van uw bedrijfslogica.

  2. Als u de beloning niet binnen de geconfigureerde beloningswachttijd retourneert, wordt de standaardbeloning geregistreerd.

Apprentice-modus evalueren

Controleer in Azure Portal op de pagina Monitor voor uw Personalizer-resource de overeenkomende prestaties.

Screenshot of reviewing evaluation of apprentice mode learning behavior in Azure portal

De leerlingmodus biedt de volgende metrische evaluatiegegevens:

  • Basislijn – gemiddelde beloning: Gemiddelde beloningen van de standaardwaarde (basislijn) van de toepassing.
  • Personalizer – gemiddelde beloning: Het gemiddelde van de totale beloningen die Personalizer mogelijk heeft bereikt.
  • Beloningsprestatieverhouding ten opzichte van de meest recente 1000 gebeurtenissen: Verhouding van basislijn- en Personalizer-beloning– genormaliseerd ten opzichte van de meest recente 1000 gebeurtenissen.

Gedrag overschakelen naar de onlinemodus

Wanneer u bepaalt dat Personalizer wordt getraind met een gemiddelde van 75-85% rolling gemiddelde, is het model klaar om over te schakelen naar de onlinemodus.

Selecteer in Azure Portal voor uw Personalizer-resource op de pagina Setup op het tabblad Modelinstellingen de optie *Onlinemodus en selecteer Opslaan.

U hoeft geen wijzigingen aan te brengen in de Rank- en Reward-API-aanroepen.

Volgende stappen