Worum handelt es sich bei der benutzerdefinierten Textklassifizierung?

Artikel
12/19/2023

Die benutzerdefinierte Textklassifizierung ist eines der benutzerdefinierten Features von Azure KI Language. Es handelt sich um einen cloudbasierten API-Dienst, der Machine Learning-Intelligenz anwendet, um Ihnen die Erstellung benutzerdefinierter Modelle für Textklassifizierungsaufgaben zu ermöglichen.

Mit benutzerdefinierter Textklassifizierung können Benutzer benutzerdefinierte KI-Modelle erstellen, um Text in benutzerdefinierte Klassen einzuteilen, die vom Benutzer vorab definiert wurden. Durch das Erstellen eines Projekts für die benutzerdefinierte Textklassifizierung können Entwickler Daten iterativ bezeichnen, trainieren und auswerten sowie die Modellleistung verbessern, bevor sie für die Nutzung verfügbar gemacht werden. Die Qualität der bezeichneten Daten wirkt sich erheblich auf die Modellleistung aus. Um das Erstellen und Anpassen Ihres Modells zu vereinfachen, steht im Dienst ein benutzerdefiniertes Webportal zur Verfügung, auf das über Language Studio zugegriffen werden kann. Sie können problemlos erste Schritte mit dem Dienst ausführen, indem Sie diese Schnellstartanleitung befolgen.

Benutzerdefinierte Textklassifizierung unterstützt zwei Arten von Projekten:

Klassifizierung mit einzelner Bezeichnung: Sie können jeder Datei In Ihrem Dataset eine einzelne Klasse zuweisen. Beispielsweise könnte ein Drehbuch entweder als „Liebesfilm“ oder als „Komödie“ klassifiziert werden.
Klassifizierung mit mehreren Bezeichnungen: Sie können jedem Dokument in Ihrem Dataset mehrere Klassen zuweisen. Beispielsweise kann ein Drehbuch als „Komödie“ oder als „Liebesfilm“ und „Komödie“ eingestuft werden.

Diese Dokumentation enthält die folgenden Arten von Artikeln:

Schnellstarts sind Anleitungen zu den ersten Schritten, die Sie durch das Senden von Anforderungen an den Dienst führen.
Die Artikel zu Konzepten enthalten Erläuterungen der Dienstfunktionen und -features.
Anleitungen enthalten Anweisungen zur spezifischeren oder individuelleren Verwendung des Diensts.

Beispiele für Nutzungsszenarien

Benutzerdefinierte Textklassifizierung kann in mehreren Szenarien in verschiedenen Branchen verwendet werden:

Automatische E-Mails oder Ticketselektierung

Supportcenter aller Arten erhalten eine große Anzahl von E-Mails oder Tickets, die unstrukturierten, Freitext und Anhänge enthalten. Die rechtzeitige Überprüfung, Bestätigung und Weiterleitung an fachliche Ansprechpartner in internen Teams ist von entscheidender Bedeutung. Die E-Mail-Selektierung in diesem Umfang erfordert die Überprüfung und Weiterleitung an die richtigen Abteilungen, was Zeit und Ressourcen kostet. Mithilfe der benutzerdefinierte Textklassifizierung können eingehende Texte analysiert und ihre Inhalte kategorisiert werden, damit sie automatisch an die zuständige Abteilung weitergeleitet werden, um die erforderlichen Maßnahmen zu ergreifen.

Knowledge Mining zum Verbessern/Anreichern der semantischen Suche

Search dient als wichtige Grundlage für jede App, mit der Textinhalte für Benutzer angezeigt werden. Häufige Szenarien sind die Katalog- oder Dokumentsuche, die Suche nach Einzelhandelsprodukten oder das Knowledge Mining bei Data Science. Viele Unternehmen aus verschiedenen Branchen möchten eine umfangreiche Suchumgebung für private, heterogene Inhalte erstellen, die sowohl strukturierte als auch unstrukturierte Dokumente umfassen. Als Teil ihrer Pipeline können Entwickler die benutzerdefinierte Textklassifizierung verwenden, um Text in Klassen einzuteilen, die für ihre Branche relevant sind. Mithilfe der vorhergesagten Klassen kann die Indizierung der Datei für eine stärker angepasste Sucherfahrung angereichert werden.

Lebenszyklus der Projektentwicklung

Das Erstellen eines Projekts für die benutzerdefinierte Textklassifizierung umfasst in der Regel mehrere unterschiedliche Schritte.

Führen Sie die folgenden Schritte aus, um Ihr Modell optimal zu nutzen:

Definieren des Schemas: Sie müssen Ihre Daten kennen und die Klassen identifizieren, zwischen denen Sie unterscheiden möchten, um Mehrdeutigkeit zu vermeiden.
Bezeichnen von Daten: Die Qualität der Datenbezeichnung ist ein wichtiger Faktor beim Ermitteln der Modellleistung. Dokumente, die zur gleichen Klasse gehören, sollten immer die gleiche Klasse aufweisen. Wenn Sie über ein Dokument verfügen, das zwei Klassen zugeteilt werden kann, verwenden Sie Projekte für die Klassifizierung mit mehreren Bezeichnungen. Vermeiden Sie mehrdeutige Klassen, und stellen Sie sicher, dass Ihre Klassen eindeutig voneinander getrennt werden können, insbesondere bei Projekten zur Klassifizierung mit einzelnen Bezeichnungen.
Trainieren des Modells: Ihr Modell beginnt mit dem Lernen auf der Grundlage der bezeichneten Daten.
Anzeigen der Modellleistung: Zeigen Sie die Auswertungsdetails für Ihr Modell an, um zu ermitteln, wie gut es bei der Einführung für neue Daten funktioniert.
Bereitstellen des Modells: Durch die Bereitstellung eines Modells wird dieses zur Verwendung über die Analyse-API zur Verfügung gestellt.
Klassifizieren von Text: Verwenden Sie Ihr benutzerdefiniertes Modell für Aufgaben für die benutzerdefinierte Textklassifizierung.

Referenzdokumentation und Codebeispiele

Wenn Sie die benutzerdefinierte Textklassifizierung verwenden, lesen Sie die folgende Referenzdokumentation und sehen Sie sich die Beispiele für Azure KI Language an:

Entwicklungsoption/Sprache	Referenzdokumentation	Beispiele
REST-APIs (Dokumenterstellung)	REST-API-Dokumentation
REST-APIs (Runtime)	REST-API-Dokumentation
C# (Runtime)	C#-Dokumentation	C#-Beispiele: Klassifizierung mit einzelnen Bezeichnungen C#-Beispiele: Klassifizierung mit mehreren Bezeichnungen
Java (Runtime)	Java-Dokumentation	Java-Beispiele: Klassifizierung mit einzelnen Bezeichnungen Java-Beispiele: Klassifizierung mit mehreren Bezeichnungen
JavaScript (Runtime)	JavaScript-Dokumentation	JavaScript-Beispiele: Klassifizierung mit einzelnen Bezeichnungen JavaScript-Beispiele: Klassifizierung mit mehreren Bezeichnungen
Python (Runtime)	Python-Dokumentation	Python-Beispiele: Klassifizierung mit einzelnen Bezeichnungen Python-Beispiele: Klassifizierung mit mehreren Bezeichnungen

Verantwortungsbewusste künstliche Intelligenz

Ein KI-System umfasst nicht nur die Technologie, sondern auch die Personen, die das System verwenden, die davon betroffenen Personen und die Umgebung, in der es bereitgestellt wird. Weitere Informationen zur Verwendung und Bereitstellung von verantwortungsvoller KI in Ihren Systemen finden Sie im Transparenzhinweis für die benutzerdefinierte Textklassifizierung. Weitere Informationen finden Sie auch in den folgenden Artikeln:

Nächste Schritte

Verwenden Sie diesen Schnellstartartikel, um mit der Verwendung der benutzerdefinierten Textklassifizierung zu beginnen.
Lesen Sie beim Durchlaufen des Lebenszyklus der Projektentwicklung das Glossar, um mehr über die Begriffe zu erfahren, die in der Dokumentation für dieses Feature verwendet werden.
Informationen zu Aspekten wie regionale Verfügbarkeit finden Sie in den Diensteinschränkungen.