El bloque Watson Natural Language Processing Categories asigna nodos individuales dentro de una taxonomía jerárquica a un documento de entrada. Por ejemplo, en el texto IBM anuncia nuevos avances en informática cuántica, los ejemplos de categorías extraídas son technology and computing/hardware/computer
y technology and computing/operating systems
. Estas categorías representan nodos de nivel 3 y nivel 2 en una taxonomía jerárquica.
Este bloque difiere del bloque de clasificación en que el entrenamiento se inicia a partir de un conjunto de frases de semilla asociadas con cada nodo de la taxonomía y no requiere documentos etiquetados.
Tenga en cuenta que el bloque de categorización de texto jerárquico sólo se puede utilizar en un cuaderno que se inicie en un entorno que incluya la biblioteca de Watson Natural Language Processing.
Nombre de bloque
categories_esa_en_stock
Idiomas soportados
El bloque Categorías está disponible para los idiomas siguientes. Para obtener una lista de los códigos de idioma y el idioma correspondiente, consulte Códigos de idioma.
de, en
Prestaciones
Utilice este bloque para determinar los temas de los documentos en la web categorizando las páginas web en una taxonomía de temas de dominio general, para la colocación de anuncios y la recomendación de contenido. El modelo fue probado a partir de datos de informes de noticias y páginas web generales.
Para obtener una lista de las categorías que se pueden devolver, consulte Tipos de categoría.
Dependencias de otros bloques
El bloque siguiente debe ejecutarse antes de poder ejecutar el bloque de categorización jerárquica:
syntax_izumo_<language>_stock
Ejemplo de código
import watson_nlp
# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')
# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')
# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)
Ejemplo de salida de código:
{
"categories": [
{
"labels": [
"technology & computing",
"computing"
],
"score": 0.992489,
"explanation": []
},
{
"labels": [
"science",
"physics"
],
"score": 0.945449,
"explanation": []
}
],
"producer_id": {
"name": "ESA Hierarchical Categories",
"version": "1.0.0"
}
}
Tema principal: Watson