Mi az az egyéni szövegbesorolás?

Az egyéni szövegbesorolás az Azure AI Language által kínált egyéni funkciók egyike. Ez egy felhőalapú API-szolgáltatás, amely gépi tanulási intelligenciát alkalmaz, hogy lehetővé tegye egyéni modellek készítését a szövegbesorolási feladatokhoz.

Az egyéni szövegbesorolás lehetővé teszi, hogy a felhasználók egyéni AI-modelleket készítsenek a szöveg felhasználó által előre meghatározott egyéni osztályokba való besorolásához. Egyéni szövegbesorolási projekt létrehozásával a fejlesztők iteratív módon címkézhetik az adatokat, betaníthatják, kiértékelhetik és javíthatják a modell teljesítményét, mielőtt használatba vehetővé teszik. A címkézett adatok minősége nagyban befolyásolja a modell teljesítményét. A modell létrehozásának és testreszabásának egyszerűsítése érdekében a szolgáltatás egy egyéni webportált kínál, amely a Language Studióban érhető el. A szolgáltatás használatának megkezdéséhez kövesse az alábbi rövid útmutató lépéseit.

Az egyéni szövegbesorolás kétféle projektet támogat:

  • Egycímke-besorolás – egyetlen osztályt rendelhet hozzá az adathalmaz minden dokumentumához. Egy filmszkript például csak "Romantika" vagy "Komédia" besorolású lehet.
  • Többcímke-besorolás – az adathalmaz minden dokumentumához több osztályt rendelhet hozzá. Egy filmszkript például "Komédia" vagy "Romantika" és "Komédia" besorolású lehet.

Ez a dokumentáció a következő cikktípusokat tartalmazza:

  • A rövid útmutatók útmutatást adnak a szolgáltatásnak küldött kérések teljesítéséhez.
  • A fogalmak magyarázatot nyújtanak a szolgáltatás funkcióira és funkcióira.
  • Az útmutatók a szolgáltatás konkrétabb vagy testre szabottabb módon történő használatára vonatkozó utasításokat tartalmaznak.

Példa használati forgatókönyvekre

Az egyéni szövegbesorolás több különböző iparágban is használható:

Automatikus e-mailek vagy jegyátvétel

Az összes típusú támogatási központ nagy mennyiségű e-mailt vagy jegyet kap, amely strukturálatlan, szabadkéményes szöveget és mellékleteket tartalmaz. A belső csapatokon belüli témaszakértők időben történő áttekintése, nyugtázása és útválasztása kritikus fontosságú. Email ilyen szintű osztályozáshoz a felhasználóknak át kell tekintenie és a megfelelő részlegek felé kell irányítaniuk, ami időt és erőforrásokat igényel. Az egyéni szövegbesorolás használható a bejövő szövegek elemzésére, valamint a tartalom osztályozására és kategorizálására, hogy az automatikusan a megfelelő részlegekhez legyen irányítva további műveletek céljából.

A keresés minden olyan alkalmazás alapja, amely szöveges tartalmat jelenít meg a felhasználók számára. A gyakori forgatókönyvek közé tartoznak például a katalógus- vagy dokumentumkeresések, a kiskereskedelmi termékkeresések vagy az adatelemzési tudásbányászat. Számos vállalat különböző iparágakban arra törekszik, hogy gazdag keresési élményt hozzon létre privát, heterogén tartalmakon keresztül, amelyek strukturált és strukturálatlan dokumentumokat is tartalmaznak. A folyamat részeként a fejlesztők egyéni szövegbesorolással kategorizálhatják a szövegüket az iparáguk szempontjából releváns osztályokba. Az előrejelzett osztályok a fájl indexelésének bővítésére használhatók a testre szabottabb keresési élmény érdekében.

Projektfejlesztési életciklus

Egyéni szövegbesorolási projekt létrehozása általában több különböző lépésből áll.

A fejlesztési életciklus

Kövesse az alábbi lépéseket, hogy a lehető legtöbbet hozhassa ki a modellből:

  1. A séma meghatározása: Ismerje meg az adatokat, és azonosítsa azokat az osztályokat , amelyek között különbséget szeretne tenni a kétértelműség elkerülése érdekében.

  2. Adatok címkézése: Az adatok címkézésének minősége kulcsfontosságú tényező a modell teljesítményének meghatározásában. Az ugyanahhoz az osztályhoz tartozó dokumentumoknak mindig ugyanazzal az osztálysal kell rendelkezniük, ha olyan dokumentuma van, amely két osztályba sorolható, többcímke-besorolási projekteket használ. Kerülje az osztályok kétértelműségét, győződjön meg arról, hogy az osztályok egyértelműen el vannak különíthetők egymástól, különösen az egycímkés besorolási projektek esetében.

  3. A modell betanítása: A modell elkezd tanulni a címkézett adatokból.

  4. A modell teljesítményének megtekintése: Tekintse meg a modell kiértékelési adatait annak megállapításához, hogy milyen jól teljesít az új adatok bevezetésekor.

  5. A modell üzembe helyezése: A modell üzembe helyezése elérhetővé teszi az Analyze API-n keresztül.

  6. Szöveg osztályozása: Egyéni modell használata egyéni szövegbesorolási feladatokhoz.

Referenciadokumentáció és kódminták

Az egyéni szövegbesorolás használata során tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:

Fejlesztési lehetőség / nyelv Referenciadokumentáció Példák
REST API-k (létrehozás) REST API-dokumentáció
REST API-k (futtatókörnyezet) REST API-dokumentáció
C# (futtatókörnyezet) C#-dokumentáció C#-minták – Egycímke-besorolásúC#-minták – Többcímke-besorolás
Java (futtatókörnyezet) Java-dokumentáció Java-minták – Egycímke-besorolásJava-minták – Többcímke-besorolás
JavaScript (futtatókörnyezet) A JavaScript dokumentációja JavaScript-minták – Egycímke-besorolásúJavaScript-minták – Többcímke-besorolás
Python (futtatókörnyezet) Python-dokumentáció Python-minták – Egycímke-besorolásiPython-minták – Többcímke-besorolás

Felelősségteljes MI

Az AI-rendszerek nem csak a technológiát, hanem azokat az embereket is magukban foglalják, akik használni fogják, azokat, akiket érint, és a környezetet, amelyben üzembe helyezik. Az egyéni szövegbesorolás átláthatósági megjegyzésében megismerheti a felelős AI-használatot és üzembe helyezést a rendszerekben. További információért tekintse meg az alábbi cikkeket is:

Következő lépések

  • Az egyéni szövegbesorolás használatának megkezdéséhez használja a rövid útmutatót .

  • Ahogy végighalad a projektfejlesztési életcikluson, tekintse át a szószedetet , hogy többet tudjon meg a funkció dokumentációjában használt kifejezésekről.

  • Ne felejtse el megtekinteni az olyan információk szolgáltatáskorlátait , mint a regionális elérhetőség.