0 / 0
Volver a la versión inglesa de la documentación
Elección de una herramienta
Elección de una herramienta

Elección de una herramienta

Los servicios principales para Cloud Pak for Data as a Service proporcionan una serie de herramientas para usuarios con todos los niveles de experiencia para preparar, analizar y modelar datos, desde principiantes hasta expertos. La herramienta adecuada que debe utilizar depende del tipo de datos que tenga, de las tareas que tiene previsto realizar y de la cantidad de automatización que desea.

Para elegir la herramienta adecuada, tenga en cuenta estos factores.

El tipo de datos que tiene

  • Datos tabulados en archivos delimitados o datos relacionales en orígenes de datos remotos
  • Archivos de imagen
  • Datos textuales (no estructurados) en documentos

El tipo de tareas que debe realizar

  • Preparar datos: limpiar, dar forma, visualizar, organizar y validar datos.
  • Analizar datos: identificar patrones y relaciones en los datos para visualizar los conocimientos obtenidos.
  • Crear modelos: crear, formar, probar y desplegar modelos para clasificar datos, realizar predicciones u optimizar decisiones.

La cantidad de automatización que desea

  • Herramientas del editor de código: se utiliza para escribir código en Python, R o Scala, todos también con Spark.
  • Herramientas de creador gráfico: utilice menús y funciones de tipo arrastrar y soltar en un constructor para programar visualmente.
  • Herramientas de constructor automatizadas: se utiliza para configurar tareas automatizadas que requieren una entrada de usuario limitada.

Encuentre la herramienta más adecuada:

Herramientas para datos tabulados o relacionales

Herramientas para datos tabulados o relacionales por tarea:

Herramientas para datos tabulados o relacionales
Herramienta Tipo de herramienta Preparar datos Analizar datos Crear modelos
Editor de cuaderno de Jupyter Editor de código
Aprendizaje federado Editor de código
RStudio Editor de código
Data Refinery Creador gráfico
Privacidad de datos Creador automatizado
Watson Query Creador gráfico
DataStage Creador gráfico
Editor de panel de control Creador gráfico
SPSS Modeler Creador gráfico
Creador de modelos de Decision Optimization Creador gráfico y editor de código
AutoAI Creador automatizado
Metadata import Creador automatizado
Enriquecimiento de metadatos Creador automatizado
IBM Match 360 with Watson (Beta) Creador automatizado
Watson Pipelines Creador gráfico

Herramientas para datos textuales

Herramientas para crear un modelo que clasifica datos textuales:

Herramientas para datos textuales
Herramienta Editor de código Creador gráfico Creador automatizado
Editor de cuaderno de Jupyter
RStudio
SPSS Modeler
Watson Pipelines

Herramientas para datos de imagen

Herramientas para crear un modelo que clasifica imágenes:

Herramientas para datos de imagen
Herramienta Editor de código Creador gráfico Creador automatizado
Editor de cuaderno de Jupyter
RStudio
Watson Pipelines

Acceso a las herramientas

Para utilizar una herramienta, debe crear un activo específico para dicha herramienta, o abrir un activo existente para dicha herramienta. Para crear un activo, pulse Nuevo activo y, a continuación, seleccione el tipo de activo que desee. En esta tabla se muestra el tipo de activo que se debe elegir para cada herramienta.

Correlación entre herramientas y tipos de activo
Para utilizar esta herramienta Elija este tipo de activo
Editor de cuaderno de Jupyter Editor de cuaderno de Jupyter
Data Refinery Flujo de Data Refinery
Privacidad de datos Flujos de enmascaramiento
DataStage Flujo de DataStage
Editor de panel de control Panel de control
SPSS Modeler Flujo de Modeler
Creador de modelos de Decision Optimization Decision Optimization
AutoAI Experimento AutoAI
Aprendizaje federado Experimento de Federated Learning
Metadata import Metadata import
Enriquecimiento de metadatos Enriquecimiento de metadatos
IBM Match 360 with Watson (Beta) Configuración de datos maestros

Para editar cuadernos con RStudio, pulse Iniciar IDE > RStudio.

Editor de cuaderno de Jupyter

Utilice el editor de cuaderno de Jupyter para crear un cuaderno en el que se ejecuta el código para preparar, visualizar y analizar datos, o para crear y formar un modelo.

Servicio necesario Watson Studio

Formato de datos Cualquiera

Tamaño de datos Cualquiera

Cómo puede preparar datos, analizar datos o crear modelos Escriba código en Python, R o Scala, todo ello también con Spark. Incluya texto enriquecido y soporte con su código. Trabajar con cualquier tipo de datos del modo que desee. Utilice preinstalado o instale otras bibliotecas y paquetes de IBM y de código abierto. Planificar ejecuciones del código Importar un cuaderno desde un archivo, un URL o la galería. Comparta externamente copias de sólo lectura del cuaderno.

Cómo empezar Para crear un cuaderno, pulse Nuevo activo > Cuaderno.

Más información Cargar y analizar vídeo de conjuntos de datos públicos Vídeos sobre cuadernos Cuadernos de ejemplo Documentación sobre cuadernos

Data Refinery

Utilice Data Refinery para preparar y visualizar datos tabulados con un editor de flujo gráfico. Puede crear y, a continuación, ejecutar un flujo de Data Refinery como un conjunto de operaciones ordenadas en los datos.

Servicios necesarios Watson Studio o Watson Knowledge Catalog

Formato de datos Tabular: Avro, CSV, JSON, Microsoft Excel (formatos xls y xlsx. Primera hoja solamente, excepto para conexiones y activos de datos conectados.), Parquet, SAS con la extensión "sas7bdat" (sólo lectura), TSV (sólo lectura) o activo de datos de texto delimitado
Relacional: Tablas en orígenes de datos relacionales

Tamaño de datos Cualquiera

Cómo preparar los datos Depure, dé forma y organice datos con más de 60 operaciones. Guarde los datos refinados como un nuevo conjunto de datos o actualice los datos originales. Analizar datos para validarlos. Utilice plantillas interactivas para manipular datos con operaciones de código, funciones y operadores lógicos. Planificar operaciones recurrentes en los datos.

Cómo puede analizar datos Identificar patrones, conexiones y relaciones dentro de los datos en varios gráficos de visualización.

Cómo empezar

Para crear un flujo de Data Refinery , pulse Nuevo activo > Data Refinery.

Más información Vídeos sobre Data Refinery Vídeo de datos de forma
Documentación sobre Data Refinery

Watson Query

Utilice Watson Query para conectar varios orígenes de datos en una única recopilación de autoequilibrio de orígenes de datos o bases de datos.

Formato de datos Relational: Tablas en orígenes de datos relacionales

Tamaño de datos Cualquiera

Cómo preparar los datos Conéctese a varios orígenes de datos. Crear tablas virtuales.

Cómo empezar Para crear tablas virtuales, pulse Datos > Virtualización de datos. En el menú de servicio, pulse Virtualización > Virtualizar > Tablas.

Más información Watson Query documentación

DataStage

Utilice DataStage para preparar y visualizar datos tabulados con un editor de flujo gráfico. Puede crear y, a continuación, ejecutar un flujo de DataStage como un conjunto de operaciones ordenadas en los datos.

Formato de datos Tabular: Avro, CSV, JSON, Parquet, TSV (solo lectura) o archivos de texto delimitados
Relational: Tablas en orígenes de datos relacionales

Tamaño de datos Cualquiera

Cómo preparar los datos Diseñe un flujo de integración de datos gráfico que genere código de Orchestrate para que se ejecute en el motor paralelo DataStage de alto rendimiento. Realizar operaciones como: Unir, Canalizar, Suma de comprobación, Fusionar, Modificar, Eliminar duplicados y Ordenar.

Cómo empezar

Para crear un flujo de DataStage , pulse Nuevo activo > Flujo de DataStage.

Más información DataStage documentación

Editor de panel de control

Utilice el editor de panel de instrumentos para crear un conjunto de visualizaciones de resultados analíticos en un constructor gráfico.

Servicio necesario Cognos Dashboard Embedded

Formato de datos Tabular: Archivos CSV Relational: Tablas en algunos orígenes de datos relacionales

Tamaño de datos Cualquier tamaño

Cómo puede analizar datos Crear gráficos sin codificación. Incluya texto, soporte, páginas web, imágenes y formas en el panel de control. Compartir paneles de control interactivos externamente.

Cómo empezar

Para crear un panel de control, pulse Nuevo activo > Panel de control.

Más información

Vídeos sobre paneles de instrumentos
Documentación sobre paneles de instrumentos

SPSS Modeler

Utilice SPSS Modeler para crear un flujo para preparar datos y crear y entrenar un modelo con un editor de flujo en un constructor gráfico.

Servicios necesarios Watson Studio

Formatos de datos Relacionales: tablas en orígenes de datos relacionales Tabular: archivos Excel (.xls o .xlsx), archivos CSV, o archivos SPSS Statistics (.sav) Textual: en las tablas o archivos relacionales soportados

Tamaño de datos Cualquiera

Cómo preparar los datos Utilizar funciones automáticas de preparación de datos. Escriba sentencias SQL para manipular datos. Limpiar, formar, muestrear, ordenar y derivar datos.

Cómo puede analizar datos Visualice los datos con más de 40 gráficos. Identificar el idioma natural de un campo de texto.

Cómo puede crear modelos Cree modelos predictivos. Elija entre más de 40 algoritmos de modelado. Utilizar funciones de modelado automático. Modelar series temporales o datos geoespaciales.
Clasificar datos textuales. Identifique las relaciones entre los conceptos en los datos textuales.

Cómo empezar Para crear un flujo SPSS Modeler, pulse Nuevo activo > Flujo de Modeler y seleccione IBM SPSS Modeler.

Más información SPSS Modeler -UI renovada para un vídeo potente de ciencia de datos empresarial Documentación sobre SPSS Modeler

Creador de modelos de Decision Optimization

Decision Optimization sirve para crear y ejecutar modelos de optimización en el modelador de Decision Optimization o en un cuaderno de Jupyter.

Servicios necesarios Watson Studio

Formatos de datos Tabular: Archivos CSV

Tamaño de datos Cualquiera

Cómo preparar los datos Importe datos relevantes en un escenario y editarlos.

Cómo puede crear modelos Cree modelos de optimización de decisiones prescriptivos. Cree, importe y edite modelos en Python DOcplex, OPL o con expresiones de lenguaje natural. Cree, importe y edite modelos en cuadernos.

Cómo se pueden resolver modelos Ejecute y resuelva los modelos de optimización de decisiones utilizando motores CPLEX. Investiga y compara soluciones para varios escenarios. Cree tablas, gráficos y notas para visualizar datos y soluciones para uno o varios escenarios.

Cómo empezar Para crear un modelo de Decision Optimization, pulse Nuevo activo > Decision Optimization o para cuadernos pulse Nuevo activo > Cuaderno.

Más información Vídeos sobre Decision Optimization Documentación sobre Decision Optimization

Herramienta AutoAI

La herramienta AutoAI sirve para analizar automáticamente los datos tabulares y generar interconexiones de modelo candidatas personalizadas para el problema de modelado predictivo.

Servicio necesario Watson Machine Learning

Formato de datos Tabular: archivos CSV

Tamaño de datos Depende del tipo de modelo. Consulte Visión general deAutoAI para obtener más detalles.

Cómo puede preparar los datos Transformar automáticamente los datos, como por ejemplo imputar valores perdidos y transformar el texto en valores escalares.

Cómo puede crear modelos Entrene un modelo de clasificación binaria, de clasificación multiclase o de regresión. Vea una infografía de árbol que muestra las secuencias de las etapas de entrenamiento de AutoAI . Generar un marcador de interconexiones de modelo clasificadas por puntuaciones de validación cruzada. Guardar una interconexión como modelo.

Cómo empezar Para crear un experimento de AutoAI, pulse Nuevo activo > Experimento de autoAI.

Más información Documentación sobre AutoAI

Federated Learning

Utilice la herramienta de aprendizaje federado para entrenar un modelo común utilizando datos distribuidos. Los datos nunca se combinan ni se comparten, preservando la integridad de los datos al tiempo que se proporciona a todas las partes participantes un modelo basado en los datos agregados.

Servicio necesario Watson Machine Learning

Formato de datos Cualquiera

Tamaño de datos Cualquier tamaño

Cómo puede crear modelos Elija una infraestructura de entrenamiento. Configure el modelo común. Configure un archivo para entrenar el modelo común. Haga que las partes remotas entrenen sus datos. Desplegar el modelo común.

Cómo empezar Para crear un experimento, pulse Nuevo activo > Experimento de aprendizaje federado.

Más información Documentación sobre Federated Learning

Metadata import

Utilice la herramienta de importación de metadatos para descubrir e importar automáticamente metadatos técnicos y de proceso para activos de datos en un proyecto o en un catálogo.

Servicio necesario Watson Knowledge Catalog

Formato de datos Cualquiera

Tamaño de datos Cualquier tamaño

Cómo preparar los datos Importar activos de datos de una conexión a un origen de datos.

Cómo empezar Para importar metadatos, pulse Nuevo activo > Importación de metadatos.

Más información Documentación sobre la importación de metadatos Vídeos sobre Watson Knowledge Catalog

Enriquecimiento de metadatos

Utilice la herramienta de enriquecimiento de metadatos para crear automáticamente perfiles de los activos de datos y analizar la calidad de los datos de un proyecto.

Servicio necesario Watson Knowledge Catalog

Formato de datos Relacional y estructurado: Tablas y archivos en orígenes de datos relacionales y no relacionales Tabular: Archivos Avro, CSV o Parquet

Tamaño de datos Cualquier tamaño

Cómo preparar y analizar datos Perfilar y analizar un conjunto de activos de datos seleccionados en un proyecto.

Cómo empezar Para enriquecer los datos, pulse Nuevo activo > Enriquecimiento de metadatos.

Más información Documentación sobre el enriquecimiento de metadatos

IBM Match 360 with Watson

Utilice IBM Match 360 with Watson para crear entidades de datos maestros que representan gemelos digitales de sus clientes. Modele y correlacione los datos y, a continuación, ejecute el algoritmo de coincidencia para crear entidades de datos maestros. Personalice y ajuste el algoritmo de comparación para que se ajuste a los requisitos de la organización.

Servicios necesarios IBM Match 360 with Watson
IBM Watson Knowledge Catalog

Tamaño de datos Hasta 1.000.000 de registros (para el plan Beta Lite)

Cómo preparar los datos Modele y correlacione datos procedentes de diversos orígenes de la organización. Ejecute el algoritmo de coincidencia personalizable para crear entidades de datos maestros. Ver y editar entidades de datos maestros y sus registros asociados.

Cómo empezar Para crear un activo de configuración de IBM Match 360, pulse Nuevo activo > Configuración de datos maestros.

Más información Documentación sobre IBM Match 360 with Watson

IDE de RStudio

Utilice el IDE de RStudio para analizar datos o crear aplicaciones de Shiny escribiendo código R. RStudio se puede integrar en un repositorio Git que debe estar asociado al proyecto.

Servicio necesario Watson Studio

Formato de datos Cualquiera

Tamaño de datos Cualquier tamaño

Cómo puede preparar datos, analizar datos y crear modelos Escribir código en R. Crear aplicaciones Shiny. Utilice bibliotecas y paquetes de código abierto. Incluya texto enriquecido y soporte con su código. Preparar datos. Visualizar datos. Descubra información de valor a partir de los datos. Cree y entrene un modelo utilizando bibliotecas de código abierto. Comparta su app Shiny en un repositorio Git .

Cómo empezar Para utilizar RStudio, pulse Iniciar IDE > RStudio.

Más información Visión general del vídeo IDE de RStudio
Vídeos sobre RStudio
Documentación sobre RStudio

Privacidad de datos

Utilice la herramienta de privacidad de datos para preparar copias enmascaradas o subconjuntos enmascarados de datos del catálogo. Se elimina la identificación de los datos utilizando opciones de enmascaramiento avanzadas con reglas de protección de datos.

Servicio necesario Watson Knowledge Catalog

Formato de datos Relational: Tablas en orígenes de datos relacionales

Tamaño de datos Cualquier tamaño

Cómo preparar datos, analizar datos o crear modelos Importar activos de datos del catálogo gobernado en el proyecto. Cree definiciones de trabajo de flujo de enmascaramiento para especificar qué datos enmascarar con reglas de protección de datos. Opcionalmente, utilice el subconjunto de datos para reducir el tamaño de los datos copiados. Ejecute trabajos de flujo de enmascaramiento para cargar copias enmascaradas en conexiones de base de datos de destino.

Cómo empezar Asegúrese de que los pasos de requisito previo de en Watson Knowledge Catalog se hayan completado. Para privatizar los datos, realice una de las siguientes tareas:

  • Pulse Nuevo activo > Privacidad de datos.
  • Pulse en las opciones de menú de los activos de datos individuales para enmascarar directamente ese activo.

Más información Documentación sobre el enmascaramiento de datos

Interconexiones de Watson

Utilice el editor de lienzo de interconexiones para crear un flujo para preparar, visualizar y analizar datos, o para crear y entrenar un modelo.

Formato de datos Cualquiera

Tamaño de datos Cualquiera

Cómo puede preparar datos, analizar datos o crear modelos Utilice una variedad de nodos que contengan sus propios registros. Incorpore los cuadernos en el flujo para ejecutar cualquier código Python, R, Scala. Trabajar con cualquier tipo de datos del modo que desee. Planifique las ejecuciones del flujo. Importar datos de la PVC montada, proyecto o ingerir datos de Github. Cree el componente personalizado con un código Python . Condicionalice las interconexiones para supervisar la calidad de los datos como desee. Utilice webhook para enviar correos electrónicos o mensajes para mantenerse al día sobre el estado del flujo.

Cómo empezar Para crear un nuevo conducto, pulse Nuevo activo > Interconexiones.

Tema padre: Proyectos