¿Qué es la clasificación de texto personalizado?

Artículo
12/19/2023

La clasificación de texto personalizado es una de las características personalizadas que ofrece Lenguaje de Azure AI. Se trata de un servicio de API basado en la nube que aplica inteligencia de aprendizaje automático para permitirle crear modelos personalizados para tareas de clasificación de texto.

La clasificación de texto personalizado permite a los usuarios crear modelos de IA personalizados para clasificar texto en categorías personalizadas predefinidas por el usuario. Mediante la creación de un proyecto de clasificación de texto personalizado, los desarrolladores pueden etiquetar datos de forma iterativa, entrenar, evaluar y mejorar el rendimiento del modelo antes de que esté disponible para su consumo. La calidad de los datos etiquetados afecta considerablemente al rendimiento del modelo. Para simplificar la creación y personalización del modelo, el servicio ofrece un portal web personalizado al que se puede acceder a través de Language Studio. Si sigue los pasos que se indican en este inicio rápido, le resultará fácil empezar a usar el servicio.

La clasificación de texto personalizada admite dos tipos de proyectos:

Clasificación de etiqueta única: se puede asignar una sola clase a cada documento del conjunto de datos. Por ejemplo, el guion de una película solo podría clasificarse como "Romance" o como "Comedia".
Clasificación mediante varias etiquetas: se pueden asignar varias clases a cada documento del conjunto de datos. Por ejemplo, el guion de una película podría clasificarse como "Comedia" o "Romance" y como "Comedia".

Esta documentación contiene los siguientes tipos de artículos:

Los inicios rápidos son instrucciones de inicio que le guiarán a la hora de hacer solicitudes al servicio.
Los conceptos proporcionan explicaciones sobre la funcionalidad y las características del servicio.
Las guías de procedimientos contienen instrucciones para usar el servicio de una manera más específica o personalizada.

Escenarios de uso de ejemplo

La clasificación de texto personalizado se puede usar en un sinfín escenarios en diferentes ámbitos empresariales:

Evaluación automática de prioridades de correos electrónicos o vales

Los centros de soporte técnico de todo tipo reciben un gran volumen de correos electrónicos o vales que contienen texto sin estructurar y de forma libre y datos adjuntos. La revisión, confirmación y enrutamiento oportunos a expertos en la materia dentro de los equipos internos es fundamental. La evaluación de prioridades de correos electrónicos a esta escala requiere revisarlos y trasladar el asunto a los departamentos adecuados, lo que lleva tiempo y recursos. La clasificación de texto personalizado puede servir para analizar el texto entrante y evaluar y clasificar el contenido, de forma que pueda trasladarse automáticamente al departamento correspondiente para seguir adoptando medidas.

Minería del conocimiento para mejorar o enriquecer la búsqueda semántica

La búsqueda es fundamental para cualquier aplicación que ofrezca contenido de texto a los usuarios. Entre los escenarios comunes se incluyen las búsquedas de catálogos, documentos y productos minoristas o la minería de conocimiento para la ciencia de datos. Muchas empresas de varios sectores buscan crear una mejor experiencia de búsqueda de contenido privado y heterogéneo que incluya documentos tanto estructurados como no estructurados. Como parte de su canalización, los desarrolladores pueden usar la clasificación de texto personalizado para clasificar sus textos en clases que sean relevantes para su sector. Las clases predichas se pueden usar para enriquecer la indexación del archivo, con el fin de personalizar más la experiencia de búsqueda.

Ciclo de vida del desarrollo de proyectos

La creación de un proyecto de clasificación de texto personalizado suele implicar varios pasos.

Siga estos pasos para sacar el máximo partido del modelo:

Definir el esquema: conozca los datos e identifique las clases entre las que quiere marcar diferencias para evitar ambigüedades.
Etiquetar los datos: la calidad del etiquetado de datos es un factor clave para determinar el rendimiento del modelo. Los documentos que pertenecen a la misma clase siempre deben tener la misma clase. Si tiene un archivo que puede pertenecer a dos clases, use proyectos de clasificación de varias etiquetas. Evite ambigüedades de clases; asegúrese de que las clases se pueden separar claramente unas de otras, especialmente en el caso de proyectos de clasificación de etiqueta única.
Entrenar el modelo: el modelo empieza a aprender de los datos etiquetados.
Ver el rendimiento del modelo: vea los detalles de evaluación del modelo para determinar su rendimiento cuando se introduce en datos nuevos.
Implementar el modelo: la implementación de un modelo hace que esté disponible para su uso mediante Analyze API.
Clasificar el texto: use el modelo personalizado en tareas de clasificación de texto personalizado.

Documentación de referencia y ejemplos de código

Mientras usa la clasificación de texto personalizado, consulte la siguiente documentación de referencia y ejemplos de Lenguaje de Azure AI:

Idioma u opción de desarrollo	Documentación de referencia	Ejemplos
API de REST (creación)	Documentación de la API REST
API de REST (entorno de ejecución)	Documentación de la API REST
C# (entorno de ejecución)	Documentación de C#	Ejemplos de C#: clasificación de etiqueta única Ejemplos de C#: clasificación de varias etiquetas
Java (Entorno de ejecución)	Documentación de Java	Ejemplos de Java: clasificación de etiqueta única Ejemplos de Java: clasificación de varias etiquetas
JavaScript (Entorno de ejecución)	Documentación de JavaScript	Ejemplos de JavaScript: clasificación de etiqueta única Ejemplos de JavaScript: clasificación de varias etiquetas
Python (entorno de ejecución)	Documentación de Python	Ejemplos de Python: clasificación de etiqueta única Ejemplos de JavaScript: clasificación de varias etiquetas

Inteligencia artificial responsable

Los sistemas de inteligencia artificial incluyen no solo la tecnología, sino también las personas que la usarán, las personas que se verán afectadas por ella y el entorno en el que se implementa. Lea la nota de transparencia sobre la clasificación de texto personalizado para obtener información sobre el uso responsable de la inteligencia artificial y su implementación en los sistemas. También puede consultar los siguientes artículos para obtener más información:

Pasos siguientes

Tras leer el artículo de inicio rápido podrá empezar a usar la clasificación de texto personalizada.
Cuando avance por el ciclo de vida del desarrollo de proyectos, consulte el glosario para más información sobre los términos que se usan en la documentación para esta característica.
No olvide consultar los límites del servicio para obtener información como, por ejemplo, la disponibilidad regional.