Guida introduttiva: Creare un set di competenze nel portale di Azure

In questa guida introduttiva si apprenderà come un set di competenze in Ricerca di intelligenza artificiale di Azure aggiunge il riconoscimento ottico dei caratteri (OCR), l'analisi delle immagini, il rilevamento della lingua, la traduzione testuale e il riconoscimento di entità per generare contenuto ricercabile in testo in un indice di ricerca.

È possibile eseguire la procedura guidata Importa dati nel portale di Azure per applicare competenze che creano e trasformano il contenuto testuale durante l'indicizzazione. L'input è costituito dai dati non elaborati, in genere BLOB in Archiviazione di Azure. L'output è un indice ricercabile contenente testo di immagine generato dall'intelligenza artificiale, didascalia ed entità. Il contenuto generato è queryabile nel portale usando Esplora ricerche.

Per prepararsi, è necessario creare alcune risorse e caricare file di esempio prima di eseguire la procedura guidata.

Prerequisiti

Prima di iniziare, è necessario che siano soddisfatti i prerequisiti seguenti:

Nota

Questa guida introduttiva usa i servizi di intelligenza artificiale di Azure per le trasformazioni di intelligenza artificiale. Poiché il carico di lavoro è così piccolo, i servizi di intelligenza artificiale di Azure vengono toccati dietro le quinte per l'elaborazione gratuita per un massimo di 20 transazioni. È possibile completare questo esercizio senza dover creare una risorsa multiservizio per intelligenza artificiale di Azure.

Configurare i dati

Nei passaggi seguenti si configura un contenitore BLOB in Archiviazione di Azure in cui archiviare file di contenuto eterogenei.

  1. Scaricare i dati di esempio costituiti da un piccolo set di file di tipi diversi.

  2. Accedere al portale di Azure con il proprio account Azure.

  3. Creare un account Archiviazione di Azure o trovare un account esistente.

    • Scegliere la stessa area di Ricerca di intelligenza artificiale di Azure per evitare addebiti per la larghezza di banda.

    • Scegliere il Archiviazione V2 (utilizzo generico V2).

  4. In portale di Azure aprire la pagina Archiviazione di Azure e creare un contenitore. È possibile usare il livello di accesso predefinito.

  5. In Contenitore selezionare Carica per caricare i file di esempio. Si noti che sono disponibili un'ampia gamma di tipi di contenuto, tra cui immagini e file dell'applicazione che non sono ricercabili full-text nei formati nativi.

    Screenshot of source files in Azure Blob Storage.

È ora possibile passare alla procedura guidata Importa dati.

Eseguire la procedura guidata Importa dati

  1. Accedere al portale di Azure con il proprio account Azure.

  2. Trovare il servizio di ricerca e nella pagina Panoramica selezionare Importa dati sulla barra dei comandi per creare contenuto ricercabile in quattro passaggi.

    Screenshot of the Import data command.

Passaggio 1: Creare un'origine dati

  1. In Connessione ai dati scegliere Archiviazione BLOB di Azure.

  2. Scegliere una connessione esistente all'account di archiviazione e selezionare il contenitore creato. Assegnare un nome origine dati e utilizzare i valori predefiniti per il resto.

    Screenshot of the data source definition page.

    Passare alla pagina successiva.

Se viene visualizzato "Errore durante il rilevamento dello schema dell'indice dall'origine dati", l'indicizzatore che sta alimentando la procedura guidata non può connettersi all'origine dati. Molto probabilmente, l'origine dati dispone di protezioni per la sicurezza. Provare le soluzioni seguenti e quindi eseguire di nuovo la procedura guidata.

Funzionalità di sicurezza Soluzione
La risorsa richiede ruoli di Azure o le relative chiavi di accesso sono disabilitate Connessione come servizio attendibile o connettersi usando un'identità gestita
La risorsa si trova dietro un firewall IP Creare una regola in ingresso per La ricerca e per portale di Azure
La risorsa richiede una connessione endpoint privato Connessione su un endpoint privato

Passaggio 2: Aggiungere competenze cognitive

Configurare quindi l'arricchimento tramite intelligenza artificiale per richiamare OCR, l'analisi delle immagini e l'elaborazione del linguaggio naturale.

  1. Per questa guida introduttiva si usa la risorsa Gratuita dei servizi di intelligenza artificiale di Azure. I dati di esempio sono costituiti da 14 file, quindi l'allocazione gratuita di 20 transazioni nei servizi di intelligenza artificiale di Azure è sufficiente per questa guida introduttiva.

    Screenshot of the Attach Azure AI services tab.

  2. Espandere Aggiungi arricchimenti ed effettuare sei selezioni.

    Abilitare OCR per aggiungere le competenze di analisi delle immagini alla pagina della procedura guidata.

    Scegliere il riconoscimento delle entità (persone, organizzazioni, posizioni) e le competenze di analisi delle immagini (tag, didascalia).

    Screenshot of the skillset definition page.

    Passare alla pagina successiva.

Passaggio 3: Configurare l'indice

Un indice contiene il contenuto ricercabile e la procedura guidata Importa dati può in genere creare lo schema eseguendo il campionamento dell'origine dati. In questo passaggio occorre esaminare lo schema generato e potenzialmente rivedere le impostazioni.

Per questa Guida introduttiva, la procedura guidata ha imposta valori predefiniti ragionevoli in modo efficace:

  • I campi predefiniti sono basati sulle proprietà dei metadati dei BLOB esistenti, oltre ai nuovi campi per l'output di arricchimento ( ad esempio , peopleorganizations, locations). I tipi di dati vengono dedotti dai metadati e mediante il campionamento dei dati.

  • La chiave di documento predefinita è metadata_storage_path (selezionata perché il campo contiene valori univoci).

  • Gli attributi predefiniti sono Recuperabile e Ricercabile. L'attributo Ricercabile indica che è possibile eseguire ricerche full-text in un campo. L'attributo Recuperabile indica che i valori dei campi possono essere restituiti nei risultati. La procedura guidata presuppone che si voglia rendere questi campi recuperabili e ricercabili perché sono stati creati con un insieme di competenze. Selezionare Filtrabile se si desidera utilizzare i campi in un'espressione di filtro.

    Screenshot of the index definition page.

Contrassegnare un campo come Recuperabile non significa che il campo deve essere presente nei risultati della ricerca. È possibile controllare la composizione dei risultati della ricerca usando il parametro di query select per specificare i campi da includere.

Passare alla pagina successiva.

Passaggio 4: Configurare l'indicizzatore

L'indicizzatore guida il processo di indicizzazione. Specifica il nome dell'origine dati, l'indice di destinazione e la frequenza di esecuzione. La procedura guidata Importa dati crea diversi oggetti, incluso un indicizzatore che è possibile reimpostare ed eseguire ripetutamente.

  1. Nella pagina Indicizzatore accettare il nome predefinito e selezionare Una volta.

    Screenshot of the indexer definition page.

  2. Selezionare Invia per creare ed eseguire contemporaneamente l'indicizzatore.

Monitorare lo stato

Selezionare Indicizzatori nel riquadro di spostamento sinistro per monitorare lo stato e quindi selezionare l'indicizzatore. L'indicizzazione basata sulle competenze richiede più tempo dell'indicizzazione basata su testo, in particolare OCR e analisi delle immagini.

Screenshot of the indexer status page.

Per visualizzare i dettagli sullo stato di esecuzione, selezionare Operazione riuscita (o Operazione non riuscita) per visualizzare i dettagli dell'esecuzione.

In questa demo sono presenti alcuni avvisi: "Could not execute skill because one or more skill input was invalid." indica che un file PNG nell'origine dati non fornisce un input di testo a Riconoscimento entità. Questo avviso si verifica perché la competenza OCR upstream non riconosce alcun testo nell'immagine e pertanto non è riuscito a fornire un input di testo alla competenza riconoscimento entità downstream.

Gli avvisi sono comuni nell'esecuzione del set di competenze. Man mano che si ha familiarità con l'iterazione delle competenze sui dati, è possibile iniziare a notare i modelli e apprendere quali avvisi sono sicuri da ignorare.

Eseguire query in Esplora ricerche

Dopo aver creato un indice, usare Esplora ricerche per restituire i risultati.

  1. A sinistra selezionare Indici e quindi selezionare l'indice. Esplora ricerche si trova nella prima scheda.

  2. Immettere una stringa di ricerca per una query nell'indice, ad esempio satya nadella. La barra di ricerca accetta parole chiave, frasi racchiuse tra virgolette e operatori ("Satya Nadella" +"Bill Gates" +"Steve Ballmer").

I risultati vengono restituiti come JSON dettagliato, che può essere difficile da leggere, soprattutto in documenti di grandi dimensioni. Alcuni suggerimenti per la ricerca in questo strumento includono le tecniche seguenti:

  • Passare alla visualizzazione JSON per specificare i parametri risultanti dalla forma.

  • Aggiungere select per limitare i campi nei risultati.

  • Aggiungi count per visualizzare il numero di corrispondenze.

  • Usare CTRL+F per cercare proprietà o termini specifici nel codice JSON.

    Screenshot of the Search explorer page.

Ecco alcuni JSON che è possibile incollare nella visualizzazione:

{
"search": "\"Satya Nadella\" +\"Bill Gates\" +\"Steve Ballmer\"",
"count": true,
"select": "content, people"
}

Suggerimento

Le stringhe di query fanno distinzione tra maiuscole e minuscole. Se quindi viene visualizzato un messaggio di campo sconosciuto, controllare Campi o Definizione di indice (JSON) per verificare il nome e l'uso delle maiuscole/minuscole.

Risultati

È stato creato il primo set di competenze e sono stati appresi i passaggi di base dell'indicizzazione basata sulle competenze.

Alcuni concetti chiave che ci auguriamo siano stati raccolti includono le dipendenze. Un set di competenze è associato a un indicizzatore e gli indicizzatori sono specifici di Azure e dell'origine. Anche se questa guida introduttiva usa Archiviazione BLOB di Azure, sono possibili altre origini dati di Azure. Per altre informazioni, vedere Indicizzatori in Ricerca di intelligenza artificiale di Azure.

Un altro concetto importante è che le competenze operano sui tipi di contenuto e quando si lavora con contenuto eterogeneo, alcuni input vengono ignorati. File o campi di grandi dimensioni potrebbero inoltre superare i limiti dell'indicizzatore del livello di servizio. È quindi normale che vengano visualizzati avvisi quando si verificano questi eventi.

L'output viene indirizzato a un indice di ricerca ed è presente un mapping tra coppie nome-valore create durante l'indicizzazione e i singoli campi nell'indice. Internamente, la procedura guidata configura un albero di arricchimento e definisce un set di competenze, stabilendo l'ordine delle operazioni e il flusso generale. Questi passaggi sono nascosti nella procedura guidata, ma quando si inizia a scrivere codice, questi concetti diventano importanti.

Infine, si è appreso che è possibile verificare il contenuto eseguendo una query sull'indice. Alla fine, ciò che fornisce Ricerca di intelligenza artificiale di Azure è un indice ricercabile, che è possibile eseguire query usando la sintassi di query semplice o completamente estesa. Un indice che contiene campi arricchiti è come qualsiasi altro. Se si vogliono incorporare analizzatori standard o personalizzati, profili di punteggio, sinonimi, navigazione in base a facet, ricerca geografica o qualsiasi altra funzionalità di Ricerca di intelligenza artificiale di Azure, è certamente possibile farlo.

Pulire le risorse

Quando si lavora nella propria sottoscrizione, al termine di un progetto è buona norma determinare se le risorse create sono ancora necessarie. Le risorse che rimangono in esecuzione hanno un costo. È possibile eliminare risorse singole oppure gruppi di risorse per eliminare l'intero set di risorse.

Per trovare e gestire le risorse nel portale, usare il collegamento Tutte le risorse o Gruppi di risorse nel riquadro di spostamento a sinistra.

Se è stato usato un servizio gratuito, tenere presente che sono limitati a tre indici, indicizzatori e origini dati. Per non superare il limite, è possibile eliminare i singoli elementi nel portale.

Passaggi successivi

È possibile creare set di competenze usando il portale, .NET SDK o l'API REST. Per altre informazioni, provare l'API REST usando un client REST e altri dati di esempio.