A Personalizer tanulási viselkedésének konfigurálása
Fontos
2023. szeptember 20-tól nem hozhat létre új Personalizer-erőforrásokat. A Personalizer szolgáltatás 2026. október 1-jén megszűnik.
A tanulószerződéses mód megbízhatóságot és bizalmat biztosít a Personalizer szolgáltatásban és annak gépi tanulási képességeiben, és biztosítja, hogy a szolgáltatás olyan információkat kap, amelyekből tanulható – anélkül, hogy az online forgalmat kockáztatja.
A Tanonc mód konfigurálása
Jelentkezzen be az Azure Portalra a Personalizer-erőforráshoz.
A Beállítás lapon, a Modell beállításai lapon válassza a Tanulói mód lehetőséget, majd válassza a Mentés lehetőséget.
A meglévő alkalmazás módosításai
A meglévő alkalmazásnak nem szabad módosítania, hogy jelenleg hogyan választja ki a megjelenítendő műveleteket, illetve hogy az alkalmazás hogyan határozza meg a művelet értékét, jutalmát . Az alkalmazás egyetlen módosítása lehet a Personalizer Rank API-nak küldött műveletek sorrendje. Az alkalmazás által jelenleg megjelenített művelet lesz az első művelet a műveletlistában. A Rank API ezt az első műveletet használja a Personalizer-modell betanítása érdekében.
Az alkalmazás konfigurálása a Rank API meghívására
A Personalizer alkalmazáshoz való hozzáadásához meg kell hívnia a Rank és a Reward API-kat.
Adja hozzá a Rank API-hívást a meglévő alkalmazáslogika azon pontja után, ahol meghatározza a műveletek listáját és azok funkcióit. A műveletek listájának első műveletének a meglévő logika által kiválasztott műveletnek kell lennie.
Konfigurálja a kódot a Rank API-válasz reward action id azonosítójához társított művelet megjelenítéséhez.
Az alkalmazás konfigurálása a Reward API meghívására
Megjegyzés:
A Reward API-hívások nem befolyásolják a tanonc módban történő betanítást. A szolgáltatás az alkalmazás aktuális logikájának vagy alapértelmezett műveleteinek egyeztetésével tanul. A Reward-hívások ezen a szakaszon történő implementálása azonban segít abban, hogy később az Azure Portalon egy egyszerű kapcsolóval zökkenőmentesen váltson online módra. Emellett a rendszer naplózza a jutalmakat, így elemezheti, hogy az aktuális logika milyen jól működik, és mennyi jutalom érkezik.
A meglévő üzleti logikával kiszámíthatja a megjelenített művelet jutalmát . Az értéknek 0 és 1 közötti tartományban kell lennie. Küldje el ezt a jutalmat a Personalizernek a Reward API használatával. A jutalomérték nem várható azonnal, és az üzleti logikától függően egy adott időszakban késleltethető.
Ha nem adja vissza a jutalmat a konfigurált reward várakozási időn belül, az alapértelmezett jutalom lesz naplózva.
Tanulói mód kiértékelése
Az Azure PortalOn, a Personalizer-erőforrás monitorozási lapján tekintse át az egyező teljesítményt.
A Tanulói mód a következő értékelési metrikákat biztosítja:
- Alapkonfiguráció – átlagos jutalom: Az alkalmazás alapértelmezett (alapkonfiguráció) átlagos jutalmai.
- Personalizer – átlagos jutalom: Az összes jutalom átlaga, amelyet a Personalizer esetleg elért volna.
- Jutalom-teljesítmény aránya a legutóbbi 1000 eseményhez képest: Alapterv és Személyre szabási jutalom aránya – normalizálva a legutóbbi 1000 eseményhez képest.
Viselkedés váltása Online módra
Amikor megállapítja, hogy a Personalizer átlagosan 75-85%-os gördülési átlaggal van betanítve, a modell készen áll az online módra való váltásra.
A Personalizer-erőforrás Azure Portalján, a Beállítás lapon, a Modell beállításai lapon válassza a *Online mód, majd a Mentés lehetőséget.
Nem kell módosítania a Rank és Reward API-hívásokat.