0 / 0
Volver a la versión inglesa de la documentación
Elección de una herramienta

Elección de una herramienta

Los servicios principales para Cloud Pak for Data as a Service proporcionan una serie de herramientas para usuarios con todos los niveles de experiencia para preparar, analizar y modelar datos, desde principiantes hasta expertos. La herramienta adecuada que debe utilizar depende del tipo de datos que tenga, de las tareas que tiene previsto realizar y de la cantidad de automatización que desea.

Para ver qué herramientas utiliza en un proyecto y qué servicios requieren dichas herramientas, abra la correlación de herramientas y servicios.

Para elegir la herramienta adecuada, tenga en cuenta estos factores.

El tipo de datos que tiene

  • Datos tabulados en archivos delimitados o datos relacionales en orígenes de datos remotos
  • Archivos de imagen
  • Datos textuales (no estructurados) en documentos

El tipo de tareas que debe realizar

  • Preparar datos: limpiar, dar forma, visualizar, organizar y validar datos.
  • Analizar datos: identificar patrones y relaciones en los datos para visualizar los conocimientos obtenidos.
  • Crear modelos: crear, formar, probar y desplegar modelos para clasificar datos, realizar predicciones u optimizar decisiones.

La cantidad de automatización que desea

  • Herramientas del editor de código: utilícelo para escribir código en Python o R, todo ello también con Spark.
  • Herramientas de creador gráfico: utilice menús y funciones de tipo arrastrar y soltar en un constructor para programar visualmente.
  • Herramientas de constructor automatizadas: se utiliza para configurar tareas automatizadas que requieren una entrada de usuario limitada.

Encuentre la herramienta más adecuada:

Herramientas para datos tabulados o relacionales

Herramientas para datos tabulados o relacionales por tarea:

Herramientas para datos tabulados o relacionales
Herramienta Tipo de herramienta Preparar datos Analizar datos Crear modelos
Editor de cuaderno de Jupyter Editor de código
Aprendizaje federado Editor de código
RStudio Editor de código
Data Refinery Creador gráfico
Flujo de enmascaramiento Creador automatizado
Watson Query Creador gráfico
DataStage Creador gráfico
Editor de panel de control Creador gráfico
SPSS Modeler Creador gráfico
Creador de modelos de Decision Optimization Creador gráfico y editor de código
AutoAI Creador automatizado
Metadata import Creador automatizado
Enriquecimiento de metadatos Creador automatizado
Regla de calidad de datos Editor de código y constructor automatizado
IBM Match 360 with Watson (Beta) Creador automatizado
Watson Pipelines Creador gráfico

Herramientas para datos textuales

Herramientas para crear un modelo que funcione con datos textuales:

Herramientas para datos textuales
Herramienta Editor de código Creador gráfico Creador automatizado
Editor de cuaderno de Jupyter
RStudio
SPSS Modeler
Watson Pipelines

Herramientas para datos de imagen

Herramientas para crear un modelo que clasifica imágenes:

Herramientas para datos de imagen
Herramienta Editor de código Creador gráfico Creador automatizado
Editor de cuaderno de Jupyter
RStudio
Watson Pipelines

Acceso a las herramientas

Para utilizar una herramienta, debe crear un activo específico para dicha herramienta, o abrir un activo existente para dicha herramienta. Para crear un activo, pulse Nuevo activo o Importar activos y, a continuación, elija el tipo de activo que desee. En esta tabla se muestra el tipo de activo que se debe elegir para cada herramienta.

Correlación entre herramientas y tipos de activo
Para utilizar esta herramienta Elija este tipo de activo
Editor de cuaderno de Jupyter Editor de cuaderno de Jupyter
Data Refinery Flujo de Data Refinery
Flujos de enmascaramiento Flujos de enmascaramiento
DataStage Flujo de DataStage
Editor de panel de control Panel de control
SPSS Modeler Flujo de Modeler
Creador de modelos de Decision Optimization Decision Optimization
AutoAI Experimento AutoAI
Aprendizaje federado Experimento de Federated Learning
Metadata import Metadata import
Enriquecimiento de metadatos Enriquecimiento de metadatos
Reglas de calidad de datos Regla de calidad de datos
IBM Match 360 with Watson (Beta) Configuración de datos maestros

Para editar cuadernos con RStudio, pulse Iniciar IDE > RStudio.

Editor de cuaderno de Jupyter

Utilice el editor de cuaderno de Jupyter para crear un cuaderno en el que se ejecuta el código para preparar, visualizar y analizar datos, o para crear y formar un modelo.

Servicios necesarios
Watson Studio
Formato de los datos
Cualquiera
Tamaño de datos
Cualquiera
Cómo preparar datos, analizar datos o crear modelos
Escriba código en Python o R, todos también con Spark.
Incluya texto enriquecido y medios con el código.
Trabaje con cualquier tipo de datos en la forma que desee.
Utilice las bibliotecas y los paquetes preinstalados o instale otros de código y de IBM.
Planificar ejecuciones del código
Importar un cuaderno desde un archivo, un URL o el concentrador de recursos.
Comparta de forma externa copias de solo lectura del cuaderno.
Cómo empezar
Para crear un cuaderno, pulse Nuevo activo > Editor de cuadernos Jupyter.
Más información
Cargar y analizar vídeos de conjuntos de datos públicos
Vídeos sobre cuadernos
Cuadernos de ejemplo
Documentación sobre cuadernos

Data Refinery

Utilice Data Refinery para preparar y visualizar datos tabulados con un editor de flujo gráfico. Puede crear y, a continuación, ejecutar un flujo de Data Refinery como un conjunto de operaciones ordenadas en los datos.

Servicios necesarios
Watson Studio o IBM Knowledge Catalog
Formato de los datos
Tabular: Avro, CSV, JSON, Microsoft Excel (formatos xls y xlsx. Primera hoja solamente, excepto para conexiones y activos de datos conectados.), Parquet, SAS con la extensión "sas7bdat" (solo lectura), TSV (solo lectura) o activo de datos de texto delimitado
Relacional: Tablas en orígenes de datos relacionales
Tamaño de datos
Cualquiera
Cómo preparar los datos
Limpie, dé forma a los datos y organícelos con más de 60 operaciones.
Guarde los datos refinados como un nuevo conjunto de datos o actualice los datos originales.
Cree perfiles de los datos para validarlos.
Utilice plantillas interactivas para manipular datos con operaciones de código, funciones y operadores lógicos.
Planifique operaciones recurrentes en los datos.
Cómo analizar los datos
Identifique patrones, conexiones y relaciones dentro de los datos, en varios gráficos de visualización.
Cómo empezar
Para crear un flujo de Data Refinery , pulse Nuevo activo > Data Refinery. El mosaico Data Refinery se encuentra en la sección Constructores gráficos .
Más información
Documentación sobre Data refinery
Vídeos sobre Data Refinery
Vídeo Diseñar datos

Watson Query

Utilice Watson Query para conectar varios orígenes de datos en una única recopilación de autoequilibrio de orígenes de datos o bases de datos.

Formato de los datos
Relacional: Tablas en orígenes de datos relacionales
Tamaño de datos
Cualquiera
Cómo preparar los datos
Conéctese a varios orígenes de datos.
Cree tablas virtuales.
Cómo empezar
Para crear tablas virtuales, pulse Datos > Data virtualization. En el menú de servicio, pulse Virtualización > Virtualizar > Tablas.
Más información
Documentación de Watson Query

DataStage

Utilice DataStage para preparar y visualizar datos tabulados con un editor de flujo gráfico. Puede crear y, a continuación, ejecutar un flujo de DataStage como un conjunto de operaciones ordenadas en los datos.

Servicio necesario
DataStage
Formato de los datos
Tabulado: Avro, CSV, JSON, Parquet, TSV (solo lectura), o archivos de texto delimitados
Relacional: Tablas en orígenes de datos relacionales
Tamaño de datos
Cualquiera
Cómo preparar los datos
Diseñar un flujo de integración de datos gráfico que genera código de Orchestrate para ejecutarlo en el motor paralelo de DataStage de alto rendimiento.
Realizar operaciones como: Unir, Canalizar, Suma de comprobación, Fusionar, Modificar, Eliminar duplicados y Ordenar.
Cómo empezar
Para crear un flujo de DataStage , pulse Nuevo activo > DataStage. El mosaico DataStage se encuentra en la sección Constructores gráficos .
Más información
Documentación de DataStage

Editor de panel de control

Utilice el editor de panel de instrumentos para crear un conjunto de visualizaciones de resultados analíticos en un constructor gráfico.

Servicio necesario
Cognos Dashboard Embedded
Formato de los datos
Tabulado: Archivos CSV
Relacional: Tablas en algunos orígenes de datos relacionales
Tamaño de datos
Cualquier tamaño
Cómo analizar los datos
Cree gráficos sin codificación.
Incluya texto, soporte, páginas web, imágenes y formas en el panel de control de dashboard.: Comparta externamente paneles de control interactivos.
Cómo empezar
Para crear un panel de control, pulse Nuevo activo > Editor de panel de control. El mosaico Editor de panel de instrumentos se encuentra en la sección Constructores gráficos .
Más información
Documentación sobre paneles de control
Vídeos sobre paneles de control

SPSS Modeler

Utilice SPSS Modeler para crear un flujo para preparar datos y crear y entrenar un modelo con un editor de flujos en un constructor gráfico.

Servicios necesarios
Watson Studio
Formato de datos
Relacional: Tablas en orígenes de datos relacionales
Tabulados: Archivos Excel (.xls o .xlsx), archivos CSV o archivos de SPSS Statistics (.sav)
Textual: En los archivos o tablas relacionales soportadas
Tamaño de datos
Cualquiera
Cómo preparar los datos
Utilice funciones automáticas de preparación de datos.
Escriba sentencias SQL para manipular datos.
Limpie, dé forma, muestre, ordene y derive datos.
Cómo analizar los datos
Visualice datos con más de 40 tipos de gráficos.
Identifique el lenguaje de un campo de texto.
Cómo crear modelos
Cree modelos predictivos.
Elija entre más de 40 algoritmos de modelado.
Utilice funciones de modelado automático.
Modele series temporales o datos geoespaciales.
Clasifique datos textuales.
Identifique relaciones entre conceptos en datos textuales.
Cómo empezar
Para crear un flujo de SPSS Modeler , pulse Nuevo activo > SPSS Modeler.
Más información
SPSS Modeler - Vídeo Interfaz de usuario renovada para una central de ciencia de datos empresariales
Documentación sobre SPSS Modeler

Creador de modelos de Decision Optimization

Decision Optimization sirve para crear y ejecutar modelos de optimización en el modelador de Decision Optimization o en un cuaderno de Jupyter.

Servicios necesarios
Watson Studio
Formato de datos
Tabulado: Archivos CSV
Tamaño de datos
Cualquiera
Cómo preparar los datos
Importar datos relevantes en un escenario y editarlo.
Cómo crear modelos
Crear modelos de optimización de decisiones prescritivos.
Crear, importar y editar modelos en Python DOcplex, OPL o con expresiones de lenguaje natural.
Crear, importar y editar modelos en cuadernos.
Cómo resolver los modelos
Ejecutar y resolver modelos de optimización de decisiones utilizando motores CPLEX.
Investigar y comparar soluciones para varios escenarios.
Crear tablas, gráficos y notas para visualizar datos y soluciones para uno o más escenarios.
Cómo empezar
Para crear un modelo de Decision Optimization , pulse Nuevo activo > Decision Optimization, o para los cuadernos pulse Nuevo activo > Editor de cuadernos de Jupyter.
Más información
Vídeos sobre Decision Optimization
Documentación sobre Decision Optimization

Herramienta AutoAI

La herramienta AutoAI sirve para analizar automáticamente los datos tabulares y generar interconexiones de modelo candidatas personalizadas para el problema de modelado predictivo.

Servicios necesarios
Watson Machine Learning
Watson Studio
Formato de los datos
Tabulado: Archivos CSV
Tamaño de datos
Depende del tipo de modelo. Consulte Visión general deAutoAI para obtener más detalles.
Cómo preparar los datos
Transforme automáticamente los datos, como por ejemplo imputar valores perdidos y transformar el texto en valores escalares.
Cómo crear modelos
Forme una clasificación binaria, una clasificación de varias clases o un modelo de regresión.
Vea una infografía del árbol mostrando las secuencias de las etapas de entrenamiento de AutoAI.
Genere un marcador de interconexiones del modelo clasificadas por puntuaciones de validación cruzada.
Guarde una interconexión como un modelo.
Cómo empezar
Para crear un experimento de AutoAI , pulse Nuevo activo > AutoAI.
Más información
Documentación sobre AutoAI

Federated Learning

Utilice la herramienta de aprendizaje federado para entrenar un modelo común utilizando datos distribuidos. Los datos nunca se combinan ni se comparten, preservando la integridad de los datos al tiempo que se proporciona a todas las partes participantes un modelo basado en los datos agregados.

Servicios necesarios
Watson Studio
Watson Machine Learning
Formato de los datos
Cualquiera
Tamaño de datos
Cualquier tamaño
Cómo crear modelos
Seleccione una infraestructura de entrenamiento.
Configure el modelo común.
Configure un archivo para entrenar el modelo común.
Haga que las partes remotas entrenen sus datos.
Despliegue el modelo común.
Cómo empezar
Para crear un experimento, pulse Nuevo activo > Aprendizaje federado.
Más información
Documentación sobre el aprendizaje federado

Metadata import

Utilice la herramienta de importación de metadatos para descubrir e importar automáticamente metadatos técnicos y de proceso para activos de datos en un proyecto o en un catálogo.

Servicio necesario
IBM Knowledge Catalog
Formato de los datos
Cualquiera
Tamaño de datos
Cualquier tamaño
Cómo preparar los datos
Importe activos de datos desde una conexión a un origen de datos.
Cómo empezar
Para importar metadatos, pulse Nuevo activo > Metadata import.
Más información
Documentación sobre la importación de metadatos
Vídeos sobre IBM Knowledge Catalog

Enriquecimiento de metadatos

Utilice la herramienta de enriquecimiento de metadatos para crear automáticamente perfiles de los activos de datos y analizar la calidad de los datos de un proyecto.

Servicio necesario
IBM Knowledge Catalog
Formato de los datos
Relacional y estructurado: tablas y archivos en orígenes de datos relacionales y no relacionales
Tabla: Archivos Avro, CSV o Parquet
Tamaño de datos
Cualquier tamaño
Cómo preparar y analizar datos
Cree un perfil y analice un conjunto de selección de activos de datos de un proyecto.
Cómo empezar
Para enriquecer los datos, pulse Nuevo activo > Enriquecimiento de metadatos.
Más información
Documentación sobre el enriquecimiento de metadatos

Regla de calidad de datos

Utilice la herramienta de calidad de datos para crear reglas que analicen la calidad de los datos en un proyecto.

Servicio necesario
IBM Knowledge Catalog
Formato de los datos
Relacional y estructurado: tablas y archivos en orígenes de datos relacionales y no relacionales
Tabla: Archivos Avro, CSV o Parquet
Tamaño de datos
Cualquier tamaño
Cómo preparar y analizar datos
Analizar la calidad de un conjunto seleccionado de activos de datos en un proyecto.
Cómo empezar
Para crear una regla de calidad de datos, pulse Nuevo activo > Regla de calidad de datos.
Más información
Documentación sobre reglas de calidad de datos

IBM Match 360 with Watson

Utilice IBM Match 360 with Watson para crear entidades de datos maestros que representan gemelos digitales de sus clientes. Modele y correlacione los datos y, a continuación, ejecute el algoritmo de coincidencia para crear entidades de datos maestros. Personalice y ajuste el algoritmo de comparación para que se ajuste a los requisitos de la organización.

Servicios necesarios
IBM Match 360 with Watson IBM Knowledge Catalog
Tamaño de datos
Hasta 1.000.000 registros (para el plan Beta Lite)
Cómo preparar los datos
Modele y correlacione datos de orígenes en su organización.
Ejecute el algoritmo de coincidencia personalizable para crear entidades de datos maestros.
Vea y edite entidades de datos maestros y sus registros asociados.
Cómo empezar
Para crear un activo de configuración IBM Match 360 , pulse Nuevo activo > Configuración de datos maestros.
Más información
Documentación sobre IBM Match 360 con Watson

IDE de RStudio

Utilice el IDE de RStudio para analizar datos o crear aplicaciones de Shiny escribiendo código R.

Servicio necesario
Watson Studio
Formato de los datos
Cualquiera
Tamaño de datos
Cualquier tamaño
Cómo preparar datos, analizar datos y crear modelos
Escriba código en R.
Cree aplicaciones Shiny.
Utilice bibliotecas y paquetes de código abierto.
Incluya texto enriquecido y medios con el código.
Prepare datos.
Visualice datos.
Descubra información a partir de los datos.
Cree y entrene un modelo utilizando bibliotecas de código abierto.
Comparta su aplicación Shiny en un repositorio Git.
Cómo empezar
Para utilizar RStudio, pulse Iniciar IDE > RStudio.
Más información
Documentación sobre RStudio
Vídeo Visión general de IDE de RStudio
Vídeos sobre RStudio

Flujos de enmascaramiento

Utilice la herramienta de flujo de enmascaramiento para preparar copias enmascaradas o subconjuntos enmascarados de datos del catálogo. Se elimina la identificación de los datos utilizando opciones de enmascaramiento avanzadas con reglas de protección de datos.

Servicio necesario
IBM Knowledge Catalog
Formato de los datos
Relacional: Tablas en orígenes de datos relacionales
Tamaño de datos
Cualquier tamaño
Cómo preparar datos, analizar datos o crear modelos
Importe activos de datos del catálogo gobernado al proyecto.
Cree definiciones de trabajo de flujo de enmascaramiento para especificar qué datos se deben enmascarar con las reglas de protección de datos.
Opcionalmente, cree un subconjunto de datos para reducir el tamaño de los datos copiados.
Ejecute los trabajos de flujo de enmascaramiento para cargar las copias enmascaradas en conexiones de base de datos de destino.
Cómo empezar
Asegúrese de que los pasos de requisito previo en IBM Knowledge Catalog se hayan completado. Para privatizar los datos, realice una de las siguientes tareas:
  • Pulse Nuevo activo > Flujo de enmascaramiento.
  • Pulse en las opciones de menú de los activos de datos individuales para enmascarar directamente ese activo.
Más información
Documentación sobre cómo enmascarar datos

Watson Pipelines

Utilice el editor de lienzo de interconexiones para crear un flujo para preparar, visualizar y analizar datos, o para crear y entrenar un modelo.

Formato de los datos
Cualquiera
Tamaño de datos
Cualquiera
Cómo preparar datos, analizar datos o crear modelos
Utilice una variedad de nodos que contengan cada uno sus propios registros.
Incorpore cuadernos en el flujo para ejecutar cualquier Python o código R.
Trabaje con cualquier tipo de datos en la forma que desee.
Planifique las ejecuciones del flujo.
Importe datos de la PVC montada, el proyecto o ingiera datos de Github.
Cree el componente personalizado con un código Python .
Condicionalice las interconexiones para supervisar la calidad de los datos como desee.
Utilice webhook para enviar correos electrónicos o mensajes para mantenerse al día sobre el estado de su flujo.
Cómo empezar
Para crear un nuevo conducto, pulse Nuevo activo > Interconexiones.

Visualizaciones de datos

Utilice las visualizaciones de datos para descubrir información a partir de sus datos. Al explorar datos desde diferentes perspectivas con visualizaciones, puede identificar patrones, conexiones y relaciones dentro de esos datos y comprender rápidamente grandes cantidades de información.

Formato de los datos
Tabular: archivos Avro, CSV, JSON, Parquet, TSV, SAV, Microsoft Excel .xls y .xlsx, SAS, archivos de texto delimitados y datos conectados. Para obtener más información sobre los orígenes de datos soportados, consulte Conectores.
Tamaño de datos
Sin límite
Cómo empezar
Para crear una visualización, pulse Activo de datos en la lista de tipos de activos del proyecto y seleccione un activo de datos. Pulse la pestaña Visualización y elija un tipo de gráfico.
Más información
Visualización de los datos

Tema padre: Proyectos

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información