La biblioteca Watson Natural Language Processing proporciona funciones de procesamiento de lenguaje natural para el análisis de sintaxis y modelos entrenados previamente para una amplia variedad de tareas de procesamiento de texto, como el análisis de opinión, la extracción de palabras clave y la clasificación. La biblioteca de Watson Natural Language Processing está disponible solo para Python.
Con Watson Natural Language Processing, puede convertir datos no estructurados en datos estructurados, lo que hace que sea más fácil transferir y comprender los datos, en particular si está trabajando con una combinación de datos estructurados y no estructurados. Ejemplos de estos datos son registros de centros de llamadas, quejas de clientes, publicaciones en redes sociales o informes de problemas. Los datos no estructurados a menudo forman parte de un registro de datos más grande que incluye columnas con datos estructurados. Extracción de significado y estructura de los datos no estructurados y combinación de esta información con los datos de las columnas de datos estructurados:
- Le proporciona una comprensión más profunda de los datos de entrada
- Puede ayudarle a tomar mejores decisiones.
Watson Natural Language Processing proporciona modelos entrenados previamente en más de 20 idiomas. Un equipo dedicado de expertos los ha ordenado y evaluado para la calidad en cada idioma específico. Estos modelos entrenados previamente se pueden utilizar en entornos de producción sin que tenga que preocuparse por las infracciones de la licencia o propiedad intelectual.
Aunque puede crear sus propios modelos, la forma más fácil de empezar con Watson Natural Language Processing es ejecutar los modelos entrenados previamente en texto no estructurado para realizar tareas de proceso de lenguaje.
Algunos ejemplos de tareas de procesamiento de lenguaje disponibles en modelos entrenados previamente de Watson Natural Language Processing:
- Detección de idioma: detectar el idioma del texto de entrada
- Sintaxis: tokenización, lematización, etiquetado de la categoría léxica y análisis de dependencias
- Extracción de entidades: buscar menciones de entidades (como persona, organización o fecha)
- Extracción de frase de nombre: extraer frases de nombre del texto de entrada
- Clasificación de texto: analizar texto y, a continuación, asignar un conjunto de etiquetas o categorías predefinidas en función de su contenido
- Clasificación del sentimiento: ¿el documento de entrada es positivo, negativo o neutro?
- Clasificación de tonos: clasificar el tono en el documento de entrada (como excitado, frustrado o triste)
- Clasificación de emociones: clasificar la emoción del documento de entrada (como la ira o el disgusto)
- Extracción de palabras clave: extraer frases nominales que son relevantes en el texto de entrada
- Conceptos: buscar conceptos de DBPedia en el texto de entrada
- Relaciones: detectar relaciones entre dos entidades
- Categorías jerárquicas: asignar nodos individuales dentro de una taxonomía jerárquica al documento de entrada
- Inclusiones: correlacionar palabras individuales o fragmentos de texto más grandes en un espacio de vectores
Watson Natural Language Processing encapsula la funcionalidad del lenguaje natural a través de bloques y flujos de trabajo. Los bloques y flujos de trabajo dan soporte a funciones para cargar, ejecutar, entrenar y guardar un modelo.
Para obtener más información, consulte Trabajar con modelos entrenados previamente.
Algunos ejemplos de cómo puede utilizar la biblioteca Watson Natural Language Processing:
Ejecución del análisis de sintaxis en un fragmento de texto:
import watson_nlp
# Load the syntax model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
# Run the syntax model and print the result
syntax_prediction = syntax_model.run('Welcome to IBM!')
print(syntax_prediction)
Extracción de entidades de un fragmento de texto:
import watson_nlp
entities_workflow = watson_nlp.load('entity-mentions_transformer-workflow_multilingual_slate.153m.distilled')
entities = entities_workflow.run('IBM\'s CEO Arvind Krishna is based in the US', language_code="en")
print(entities.get_mention_pairs())
Para ver ejemplos de cómo utilizar la biblioteca Watson Natural Language Processing, consulte Watson.
Utilización de Watson Natural Language Processing en un cuaderno
Puede ejecutar los cuadernos Python que utilizan la biblioteca Watson Natural Language Processing en cualquiera de los entornos que se listan aquí. Las plantillas de entorno de GPU incluyen la biblioteca Watson Natural Language Processing.
DO + NLP: Indica que la plantilla de entorno incluye las bibliotecas CPLEX y DOcplex para modelar y resolver problemas de optimización de decisiones y la biblioteca de Watson Natural Language Processing.
~: Indica que la plantilla de entorno requiere el plan watsonx.ai Studio Professional. Consulte Planes de la oferta.
Nombre | Configuración de hardware | Tasa de CUH por hora |
---|---|---|
NLP + DO Runtime 24.1 en Python 3.11 XS | 2vCPU y 8 GB de RAM | 6 |
GPU V100 Tiempo de ejecución 24.1 en Python 3.11 ~ | 40 vCPU + 172 GB + 1 NVIDIA ® V100 (1 GPU) | 69 |
GPU 2xV100 Tiempo de ejecución 24.1 en Python 3.11 ~ | 80 vCPU + 344 GB + 2 NVIDIA ® V100 (2 GPU) | 136 |
Normalmente estos entornos son suficientes para ejecutar cuadernos que utilizan modelos precompilados. Si necesita un entorno más amplio, por ejemplo para entrenar sus propios modelos, puede crear una plantilla personalizada que incluya la biblioteca Watson Natural Language Processing.
- Cree una plantilla personalizada sin GPU seleccionando el tipo de motor
Default
, el tamaño de configuración de hardware que necesita y eligiendoNLP + DO Runtime 24.1 on Python 3.11
como versión de software. - Cree una plantilla personalizada con GPU seleccionando el tipo de motor
GPU
, el tamaño de configuración de hardware que necesita y eligiendoGPU Runtime 24.1 on Python 3.11
como versión de software.
Más información
- Creación de su propia plantilla de entorno
- Implantación de modelos de procesamiento del lenguaje natural en watsonx.ai Runtime
Tema padre: Cuadernos y scripts