Che cos'è la classificazione del testo personalizzata?

La classificazione del testo personalizzata è una delle funzionalità personalizzate offerte dal linguaggio di intelligenza artificiale di Azure. Si tratta di un servizio API basato sul cloud che applica l'intelligenza di Machine Learning per consentire di creare modelli personalizzati per le attività di classificazione del testo.

La classificazione del testo personalizzata consente agli utenti di creare modelli di intelligenza artificiale personalizzati per classificare il testo in classi personalizzate predefinite dall'utente. Creando un progetto di classificazione del testo personalizzato, gli sviluppatori possono etichettare in modo iterativo i dati, eseguire il training, valutare e migliorare le prestazioni del modello prima di renderli disponibili per l'utilizzo. La qualità dei dati etichettati influisce notevolmente sulle prestazioni del modello. Per semplificare la compilazione e la personalizzazione del modello, il servizio offre un portale Web personalizzato accessibile tramite Language Studio. È possibile iniziare facilmente a usare il servizio seguendo la procedura descritta in questa guida introduttiva.

La classificazione del testo personalizzata supporta due tipi di progetti:

  • Classificazione con etichetta singola : è possibile assegnare una singola classe per ogni documento nel set di dati. Ad esempio, uno script di film può essere classificato solo come "Romanticismo" o "Commedia".
  • Classificazione con più etichette : è possibile assegnare più classi per ogni documento nel set di dati. Ad esempio, uno script di film può essere classificato come "Commedia" o "Romanticismo" e "Commedia".

Questa documentazione contiene i tipi di articolo seguenti:

Esempi di scenari d'uso

La classificazione del testo personalizzata può essere usata in più scenari in un'ampia gamma di settori:

Messaggi di posta elettronica o valutazione automatica dei ticket

I centri di supporto di tutti i tipi ricevono un volume elevato di messaggi di posta elettronica o ticket contenenti testo non strutturato, testo a mano libera e allegati. La revisione, il riconoscimento e il routing tempestivi agli esperti in materia all'interno dei team interni è fondamentale. Email valutazione su questa scala richiede alle persone di esaminare e indirizzare i reparti corretti, che richiedono tempo e risorse. La classificazione del testo personalizzata può essere usata per analizzare il testo in ingresso e valutare e classificare il contenuto da instradare automaticamente ai reparti pertinenti per un'ulteriore azione.

La ricerca è fondamentale per qualsiasi app che espone contenuto di testo agli utenti. Gli scenari comuni includono ricerche di catalogo o documenti, ricerche di prodotti al dettaglio o knowledge mining per l'analisi scientifica dei dati. Molte aziende in vari settori stanno cercando di creare un'esperienza di ricerca avanzata su contenuti privati ed eterogenei, che includono documenti strutturati e non strutturati. Come parte della pipeline, gli sviluppatori possono usare la classificazione del testo personalizzata per classificare il testo in classi rilevanti per il settore. Le classi stimate possono essere usate per arricchire l'indicizzazione del file per un'esperienza di ricerca più personalizzata.

Ciclo di vita dello sviluppo del progetto

La creazione di un progetto di classificazione del testo personalizzato prevede in genere diversi passaggi.

Ciclo di vita dello sviluppo

Per sfruttare al meglio il modello, seguire questa procedura:

  1. Definire lo schema: conoscere i dati e identificare le classi tra cui si vuole distinguere, per evitare ambiguità.

  2. Etichettare i dati: la qualità dell'etichettatura dei dati è un fattore chiave per determinare le prestazioni del modello. I documenti che appartengono alla stessa classe devono avere sempre la stessa classe, se si dispone di un documento che può rientrare in due classi usano progetti di classificazione con più etichette . Evitare ambiguità di classe, assicurarsi che le classi siano chiaramente separabili l'una dall'altra, in particolare con i progetti di classificazione con etichetta singola.

  3. Eseguire il training del modello: il modello inizia a imparare dai dati etichettati.

  4. Visualizzare le prestazioni del modello: visualizzare i dettagli di valutazione per il modello per determinare il livello di prestazioni quando vengono introdotti nuovi dati.

  5. Distribuire il modello: la distribuzione di un modello lo rende disponibile per l'uso tramite l'API Analizza.

  6. Classificare il testo: usare il modello personalizzato per le attività di classificazione del testo personalizzate.

Documentazione di riferimento ed esempi di codice

Quando si usa la classificazione del testo personalizzata, vedere la documentazione di riferimento e gli esempi seguenti per il linguaggio di intelligenza artificiale di Azure:

Opzione di sviluppo/linguaggio Documentazione di riferimento Esempi
API REST (creazione) Documentazione dell'API REST
API REST (runtime) Documentazione dell'API REST
C# (runtime) Documentazione di C# Esempi C# - Esempi di classificazione con etichetta singolaC# - Classificazione con più etichette
Java (runtime) Documentazione di Java Esempi Java - Esempi Java per la classificazione a etichetta singola- Classificazione con più etichette
JavaScript (runtime) Documentazione di JavaScript Esempi di JavaScript - Esempi javaScript di classificazione a etichetta singola - Classificazione con più etichette
Python (runtime) Documentazione di Python Esempi di Python - Esempi di classificazione a etichetta singolaper Python - Classificazione con più etichette

IA responsabile

Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo useranno, le persone che ne saranno interessate e l'ambiente in cui viene distribuito. Leggere la nota sulla trasparenza per la classificazione del testo personalizzata per informazioni sull'uso e la distribuzione di intelligenza artificiale responsabili nei sistemi. Per altre informazioni, vedere anche gli articoli seguenti:

Passaggi successivi

  • Usare l'articolo di avvio rapido per iniziare a usare la classificazione del testo personalizzata.

  • Durante il ciclo di vita dello sviluppo del progetto, esaminare il glossario per altre informazioni sui termini usati in tutta la documentazione per questa funzionalità.

  • Ricordarsi di visualizzare i limiti del servizio per informazioni quali la disponibilità a livello di area.