Co je vlastní klasifikace textu?

Článek
12/19/2023

Vlastní klasifikace textu je jednou z vlastních funkcí, které nabízí jazyk Azure AI. Jedná se o cloudovou službu API, která používá inteligentní strojové učení a umožňuje vytvářet vlastní modely pro úlohy klasifikace textu.

Vlastní klasifikace textu umožňuje uživatelům vytvářet vlastní modely AI pro klasifikaci textu do vlastních tříd předdefinovaných uživatelem. Vytvořením vlastního projektu klasifikace textu můžou vývojáři iterativně označovat data, trénovat, vyhodnocovat a vylepšovat výkon modelu před tím, než je zpřístupní ke spotřebě. Kvalita označených dat výrazně ovlivňuje výkon modelu. Pro zjednodušení vytváření a přizpůsobení modelu nabízí služba vlastní webový portál, ke kterému se dostanete přes Language Studio. Se službou můžete snadno začít pracovat podle kroků v tomto rychlém startu.

Vlastní klasifikace textu podporuje dva typy projektů:

Klasifikace bez popisku – každému dokumentu v datové sadě můžete přiřadit jednu třídu. Například filmový scénář lze klasifikovat pouze jako "Romance" nebo "Komedie".
Klasifikace s více popisky – každému dokumentu v datové sadě můžete přiřadit více tříd. Například filmový scénář může být klasifikován jako "Komedie" nebo "Romance" a "Komedie".

Tato dokumentace obsahuje následující typy článků:

Rychlá zprovoznění jsou úvodní pokyny, které vás provedou vytvářením požadavků na službu.
Koncepty poskytují vysvětlení funkcí a funkcí služby.
Návody obsahují pokyny pro používání služby konkrétnějšími nebo přizpůsobenými způsoby.

Ukázkové scénáře použití

Vlastní klasifikaci textu je možné použít v různých scénářích v různých odvětvích:

Automatické třídění e-mailů nebo lístků

Centra podpory všech typů dostávají velké množství e-mailů nebo lístků obsahujících nestrukturovaný volný text a přílohy. Včasné posouzení, potvrzení a směrování na odborníky na danou problematiku v rámci interních týmů je velmi důležité. Email posouzení v tomto měřítku vyžaduje, aby lidé kontrolovali a směrovali do správných oddělení, což vyžaduje čas a prostředky. Vlastní klasifikaci textu je možné použít k analýze příchozího textu a k posouzení a kategorizaci obsahu, který se má automaticky směrovat do příslušných oddělení k dalším akcím.

Dolování znalostí za účelem vylepšení/obohacení sémantického vyhledávání

Vyhledávání je základní pro každou aplikaci, která uživatelům zobrazí textový obsah. Mezi běžné scénáře patří vyhledávání v katalogu nebo dokumentech, vyhledávání maloobchodních produktů nebo dolování znalostí pro datové vědy. Mnoho podniků v různých odvětvích se snaží vytvořit bohaté vyhledávací prostředí pro soukromý heterogenní obsah, který zahrnuje strukturované i nestrukturované dokumenty. V rámci svého kanálu můžou vývojáři pomocí vlastní klasifikace textu kategorizovat text do tříd, které jsou relevantní pro jejich odvětví. Predikované třídy lze použít k obohacení indexování souboru pro více přizpůsobené vyhledávání.

Životní cyklus vývoje projektu

Vytvoření vlastního projektu klasifikace textu obvykle zahrnuje několik různých kroků.

Pokud chcete svůj model co nejlépe použít, postupujte takto:

Definujte schéma: Seznamte se s daty a identifikujte třídy , mezi které chcete rozlišovat, abyste se vyhnuli nejednoznačnosti.
Popisování dat: Kvalita popisování dat je klíčovým faktorem při určování výkonu modelu. Dokumenty, které patří do stejné třídy, by měly mít vždy stejnou třídu, pokud máte dokument, který může spadat do dvou tříd, používají projekty klasifikace s více popisky . Vyhněte se nejednoznačnosti tříd a ujistěte se, že vaše třídy jsou jasně oddělitelné od sebe, zejména u projektů klasifikace s jedním popiskem.
Trénování modelu: Model se začne učit z označených dat.
Zobrazení výkonu modelu: Zobrazte si podrobnosti o vyhodnocení modelu, abyste zjistili, jak dobře funguje při zavedení nových dat.
Nasazení modelu: Nasazení modelu ho zpřístupní pro použití prostřednictvím rozhraní API pro analýzu.
Klasifikace textu: Vlastní model můžete použít pro úlohy vlastní klasifikace textu.

Referenční dokumentace a ukázky kódu

Při používání vlastní klasifikace textu si projděte následující referenční dokumentaci a ukázky pro jazyk Azure AI:

Možnost vývoje / jazyk	Referenční dokumentace	Ukázky
Rozhraní REST API (vytváření)	Dokumentace k rozhraní REST API
Rozhraní REST API (runtime)	Dokumentace k rozhraní REST API
C# (runtime)	Dokumentace k jazyku C#	Ukázky C# – Klasifikace bez přípony – Ukázky C# – Klasifikace s více popisky
Java (runtime)	Dokumentace k Javě	Ukázky Java – Klasifikace bez přípony – Ukázky Java – Klasifikace s více popisky
JavaScript (runtime)	Dokumentace k JavaScriptu	Ukázky JavaScriptu – Klasifikace bez přípony – JavaScriptové ukázky – Klasifikace s více popisky
Python (runtime)	Dokumentace k Pythonu	Ukázky Pythonu – Klasifikace s jedním popiskem – Ukázky Pythonu – Klasifikace s více popisky

Zodpovědná umělá inteligence

Systém AI zahrnuje nejen technologii, ale také lidi, kteří ho budou používat, lidi, kterých se to bude týkat, a prostředí, ve kterém je nasazený. Přečtěte si poznámku k transparentnosti týkající se vlastní klasifikace textu , kde se dozvíte o zodpovědném používání a nasazování AI ve vašich systémech. Další informace najdete také v následujících článcích:

Další kroky

Pokud chcete začít používat vlastní klasifikaci textu, použijte článek rychlý start .
Při procházení životního cyklu vývoje projektu si prohlédněte glosář , kde najdete další informace o termínech používaných v dokumentaci k této funkci.
Nezapomeňte si prohlédnout limity služeb pro informace, jako je regionální dostupnost.