A Personalizer tanulási viselkedésének konfigurálása

Fontos

2023. szeptember 20-tól nem hozhat létre új Personalizer-erőforrásokat. A Personalizer szolgáltatás 2026. október 1-jén megszűnik.

A tanulószerződéses mód megbízhatóságot és bizalmat biztosít a Personalizer szolgáltatásban és annak gépi tanulási képességeiben, és biztosítja, hogy a szolgáltatás olyan információkat kap, amelyekből tanulható – anélkül, hogy az online forgalmat kockáztatja.

A Tanonc mód konfigurálása

  1. Jelentkezzen be az Azure Portalra a Personalizer-erőforráshoz.

  2. A Beállítás lapon, a Modell beállításai lapon válassza a Tanulói mód lehetőséget, majd válassza a Mentés lehetőséget.

Screenshot of configuring apprentice mode learning behavior in Azure portal

A meglévő alkalmazás módosításai

A meglévő alkalmazásnak nem szabad módosítania, hogy jelenleg hogyan választja ki a megjelenítendő műveleteket, illetve hogy az alkalmazás hogyan határozza meg a művelet értékét, jutalmát . Az alkalmazás egyetlen módosítása lehet a Personalizer Rank API-nak küldött műveletek sorrendje. Az alkalmazás által jelenleg megjelenített művelet lesz az első művelet a műveletlistában. A Rank API ezt az első műveletet használja a Personalizer-modell betanítása érdekében.

Az alkalmazás konfigurálása a Rank API meghívására

A Personalizer alkalmazáshoz való hozzáadásához meg kell hívnia a Rank és a Reward API-kat.

  1. Adja hozzá a Rank API-hívást a meglévő alkalmazáslogika azon pontja után, ahol meghatározza a műveletek listáját és azok funkcióit. A műveletek listájának első műveletének a meglévő logika által kiválasztott műveletnek kell lennie.

  2. Konfigurálja a kódot a Rank API-válasz reward action id azonosítójához társított művelet megjelenítéséhez.

Az alkalmazás konfigurálása a Reward API meghívására

Megjegyzés:

A Reward API-hívások nem befolyásolják a tanonc módban történő betanítást. A szolgáltatás az alkalmazás aktuális logikájának vagy alapértelmezett műveleteinek egyeztetésével tanul. A Reward-hívások ezen a szakaszon történő implementálása azonban segít abban, hogy később az Azure Portalon egy egyszerű kapcsolóval zökkenőmentesen váltson online módra. Emellett a rendszer naplózza a jutalmakat, így elemezheti, hogy az aktuális logika milyen jól működik, és mennyi jutalom érkezik.

  1. A meglévő üzleti logikával kiszámíthatja a megjelenített művelet jutalmát . Az értéknek 0 és 1 közötti tartományban kell lennie. Küldje el ezt a jutalmat a Personalizernek a Reward API használatával. A jutalomérték nem várható azonnal, és az üzleti logikától függően egy adott időszakban késleltethető.

  2. Ha nem adja vissza a jutalmat a konfigurált reward várakozási időn belül, az alapértelmezett jutalom lesz naplózva.

Tanulói mód kiértékelése

Az Azure PortalOn, a Personalizer-erőforrás monitorozási lapján tekintse át az egyező teljesítményt.

Screenshot of reviewing evaluation of apprentice mode learning behavior in Azure portal

A Tanulói mód a következő értékelési metrikákat biztosítja:

  • Alapkonfiguráció – átlagos jutalom: Az alkalmazás alapértelmezett (alapkonfiguráció) átlagos jutalmai.
  • Personalizer – átlagos jutalom: Az összes jutalom átlaga, amelyet a Personalizer esetleg elért volna.
  • Jutalom-teljesítmény aránya a legutóbbi 1000 eseményhez képest: Alapterv és Személyre szabási jutalom aránya – normalizálva a legutóbbi 1000 eseményhez képest.

Viselkedés váltása Online módra

Amikor megállapítja, hogy a Personalizer átlagosan 75-85%-os gördülési átlaggal van betanítve, a modell készen áll az online módra való váltásra.

A Personalizer-erőforrás Azure Portalján, a Beállítás lapon, a Modell beállításai lapon válassza a *Online mód, majd a Mentés lehetőséget.

Nem kell módosítania a Rank és Reward API-hívásokat.

Következő lépések