Mi az az egyéni szövegbesorolás?

Cikk
12/19/2023

Az egyéni szövegbesorolás az Azure AI Language által kínált egyéni funkciók egyike. Ez egy felhőalapú API-szolgáltatás, amely gépi tanulási intelligenciát alkalmaz, hogy lehetővé tegye egyéni modellek készítését a szövegbesorolási feladatokhoz.

Az egyéni szövegbesorolás lehetővé teszi, hogy a felhasználók egyéni AI-modelleket készítsenek a szöveg felhasználó által előre meghatározott egyéni osztályokba való besorolásához. Egyéni szövegbesorolási projekt létrehozásával a fejlesztők iteratív módon címkézhetik az adatokat, betaníthatják, kiértékelhetik és javíthatják a modell teljesítményét, mielőtt használatba vehetővé teszik. A címkézett adatok minősége nagyban befolyásolja a modell teljesítményét. A modell létrehozásának és testreszabásának egyszerűsítése érdekében a szolgáltatás egy egyéni webportált kínál, amely a Language Studióban érhető el. A szolgáltatás használatának megkezdéséhez kövesse az alábbi rövid útmutató lépéseit.

Az egyéni szövegbesorolás kétféle projektet támogat:

Egycímke-besorolás – egyetlen osztályt rendelhet hozzá az adathalmaz minden dokumentumához. Egy filmszkript például csak "Romantika" vagy "Komédia" besorolású lehet.
Többcímke-besorolás – az adathalmaz minden dokumentumához több osztályt rendelhet hozzá. Egy filmszkript például "Komédia" vagy "Romantika" és "Komédia" besorolású lehet.

Ez a dokumentáció a következő cikktípusokat tartalmazza:

A rövid útmutatók útmutatást adnak a szolgáltatásnak küldött kérések teljesítéséhez.
A fogalmak magyarázatot nyújtanak a szolgáltatás funkcióira és funkcióira.
Az útmutatók a szolgáltatás konkrétabb vagy testre szabottabb módon történő használatára vonatkozó utasításokat tartalmaznak.

Példa használati forgatókönyvekre

Az egyéni szövegbesorolás több különböző iparágban is használható:

Automatikus e-mailek vagy jegyátvétel

Az összes típusú támogatási központ nagy mennyiségű e-mailt vagy jegyet kap, amely strukturálatlan, szabadkéményes szöveget és mellékleteket tartalmaz. A belső csapatokon belüli témaszakértők időben történő áttekintése, nyugtázása és útválasztása kritikus fontosságú. Email ilyen szintű osztályozáshoz a felhasználóknak át kell tekintenie és a megfelelő részlegek felé kell irányítaniuk, ami időt és erőforrásokat igényel. Az egyéni szövegbesorolás használható a bejövő szövegek elemzésére, valamint a tartalom osztályozására és kategorizálására, hogy az automatikusan a megfelelő részlegekhez legyen irányítva további műveletek céljából.

Tudásbányászat a szemantikai keresés javításához/bővítéséhez

A keresés minden olyan alkalmazás alapja, amely szöveges tartalmat jelenít meg a felhasználók számára. A gyakori forgatókönyvek közé tartoznak például a katalógus- vagy dokumentumkeresések, a kiskereskedelmi termékkeresések vagy az adatelemzési tudásbányászat. Számos vállalat különböző iparágakban arra törekszik, hogy gazdag keresési élményt hozzon létre privát, heterogén tartalmakon keresztül, amelyek strukturált és strukturálatlan dokumentumokat is tartalmaznak. A folyamat részeként a fejlesztők egyéni szövegbesorolással kategorizálhatják a szövegüket az iparáguk szempontjából releváns osztályokba. Az előrejelzett osztályok a fájl indexelésének bővítésére használhatók a testre szabottabb keresési élmény érdekében.

Projektfejlesztési életciklus

Egyéni szövegbesorolási projekt létrehozása általában több különböző lépésből áll.

Kövesse az alábbi lépéseket, hogy a lehető legtöbbet hozhassa ki a modellből:

A séma meghatározása: Ismerje meg az adatokat, és azonosítsa azokat az osztályokat , amelyek között különbséget szeretne tenni a kétértelműség elkerülése érdekében.
Adatok címkézése: Az adatok címkézésének minősége kulcsfontosságú tényező a modell teljesítményének meghatározásában. Az ugyanahhoz az osztályhoz tartozó dokumentumoknak mindig ugyanazzal az osztálysal kell rendelkezniük, ha olyan dokumentuma van, amely két osztályba sorolható, többcímke-besorolási projekteket használ. Kerülje az osztályok kétértelműségét, győződjön meg arról, hogy az osztályok egyértelműen el vannak különíthetők egymástól, különösen az egycímkés besorolási projektek esetében.
A modell betanítása: A modell elkezd tanulni a címkézett adatokból.
A modell teljesítményének megtekintése: Tekintse meg a modell kiértékelési adatait annak megállapításához, hogy milyen jól teljesít az új adatok bevezetésekor.
A modell üzembe helyezése: A modell üzembe helyezése elérhetővé teszi az Analyze API-n keresztül.
Szöveg osztályozása: Egyéni modell használata egyéni szövegbesorolási feladatokhoz.

Referenciadokumentáció és kódminták

Az egyéni szövegbesorolás használata során tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:

Fejlesztési lehetőség / nyelv	Referenciadokumentáció	Példák
REST API-k (létrehozás)	REST API-dokumentáció
REST API-k (futtatókörnyezet)	REST API-dokumentáció
C# (futtatókörnyezet)	C#-dokumentáció	C#-minták – Egycímke-besorolású C#-minták – Többcímke-besorolás
Java (futtatókörnyezet)	Java-dokumentáció	Java-minták – Egycímke-besorolás Java-minták – Többcímke-besorolás
JavaScript (futtatókörnyezet)	A JavaScript dokumentációja	JavaScript-minták – Egycímke-besorolású JavaScript-minták – Többcímke-besorolás
Python (futtatókörnyezet)	Python-dokumentáció	Python-minták – Egycímke-besorolási Python-minták – Többcímke-besorolás

Felelősségteljes MI

Az AI-rendszerek nem csak a technológiát, hanem azokat az embereket is magukban foglalják, akik használni fogják, azokat, akiket érint, és a környezetet, amelyben üzembe helyezik. Az egyéni szövegbesorolás átláthatósági megjegyzésében megismerheti a felelős AI-használatot és üzembe helyezést a rendszerekben. További információért tekintse meg az alábbi cikkeket is:

Következő lépések

Az egyéni szövegbesorolás használatának megkezdéséhez használja a rövid útmutatót .
Ahogy végighalad a projektfejlesztési életcikluson, tekintse át a szószedetet , hogy többet tudjon meg a funkció dokumentációjában használt kifejezésekről.
Ne felejtse el megtekinteni az olyan információk szolgáltatáskorlátait , mint a regionális elérhetőség.