0 / 0
Volver a la versión inglesa de la documentación
Categorización de texto jerárquico
Última actualización: 29 jul 2024
Categorización de texto jerárquico

El bloque Watson Natural Language Processing Categories asigna nodos individuales dentro de una taxonomía jerárquica a un documento de entrada. Por ejemplo, en el texto IBM anuncia nuevos avances en informática cuántica, los ejemplos de categorías extraídas son technology and computing/hardware/computer y technology and computing/operating systems. Estas categorías representan nodos de nivel 3 y nivel 2 en una taxonomía jerárquica.

Este bloque difiere del bloque de clasificación en que el entrenamiento se inicia a partir de un conjunto de frases de semilla asociadas con cada nodo de la taxonomía y no requiere documentos etiquetados.

Tenga en cuenta que el bloque de categorización de texto jerárquico sólo se puede utilizar en un cuaderno que se inicie en un entorno que incluya la biblioteca de Watson Natural Language Processing.

Nombre de bloque

categories_esa_en_stock

Idiomas soportados

El bloque Categorías está disponible para los idiomas siguientes. Para obtener una lista de los códigos de idioma y el idioma correspondiente, consulte Códigos de idioma.

de, en

Prestaciones

Utilice este bloque para determinar los temas de los documentos en la web categorizando las páginas web en una taxonomía de temas de dominio general, para la colocación de anuncios y la recomendación de contenido. El modelo fue probado a partir de datos de informes de noticias y páginas web generales.

Para obtener una lista de las categorías que se pueden devolver, consulte Tipos de categoría.

Dependencias de otros bloques

El bloque siguiente debe ejecutarse antes de poder ejecutar el bloque de categorización jerárquica:

  • syntax_izumo_<language>_stock

Ejemplo de código

import watson_nlp

# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')

# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')

# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)

Ejemplo de salida de código:

{
  "categories": [
    {
      "labels": [
        "technology & computing",
        "computing"
      ],
      "score": 0.992489,
      "explanation": []
    },
    {
      "labels": [
        "science",
        "physics"
      ],
      "score": 0.945449,
      "explanation": []
    }
  ],
  "producer_id": {
    "name": "ESA Hierarchical Categories",
    "version": "1.0.0"
  }
}

Tema principal: Watson

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información