Elección de una herramienta
Los servicios principales para Cloud Pak for Data as a Service proporcionan una serie de herramientas para usuarios con todos los niveles de experiencia para preparar, analizar y modelar datos, desde principiantes hasta expertos. La herramienta adecuada que debe utilizar depende del tipo de datos que tenga, de las tareas que tiene previsto realizar y de la cantidad de automatización que desea.
Para ver qué herramientas utiliza en un proyecto y qué servicios requieren dichas herramientas, abra la correlación de herramientas y servicios.
Para elegir la herramienta adecuada, tenga en cuenta estos factores.
El tipo de datos que tiene
- Datos tabulados en archivos delimitados o datos relacionales en orígenes de datos remotos
- Archivos de imagen
- Datos textuales (no estructurados) en documentos
El tipo de tareas que debe realizar
- Preparar datos: limpiar, dar forma, visualizar, organizar y validar datos.
- Analizar datos: identificar patrones y relaciones en los datos para visualizar los conocimientos obtenidos.
- Crear modelos: crear, formar, probar y desplegar modelos para clasificar datos, realizar predicciones u optimizar decisiones.
La cantidad de automatización que desea
- Herramientas del editor de código: utilícelo para escribir código en Python o R, todo ello también con Spark.
- Herramientas de creador gráfico: utilice menús y funciones de tipo arrastrar y soltar en un constructor para programar visualmente.
- Herramientas de constructor automatizadas: se utiliza para configurar tareas automatizadas que requieren una entrada de usuario limitada.
Encuentre la herramienta más adecuada:
- Herramientas para datos tabulados o relacionales
- Herramientas para datos textuales
- Herramientas para datos de imagen
- Acceso a las herramientas
Herramientas para datos tabulados o relacionales
Herramientas para datos tabulados o relacionales por tarea:
Herramienta | Tipo de herramienta | Preparar datos | Analizar datos | Crear modelos |
---|---|---|---|---|
Editor de cuaderno de Jupyter | Editor de código | ✓ | ✓ | ✓ |
Aprendizaje federado | Editor de código | ✓ | ||
RStudio | Editor de código | ✓ | ✓ | ✓ |
Data Refinery | Creador gráfico | ✓ | ✓ | |
Flujo de enmascaramiento | Creador automatizado | ✓ | ||
Watson Query | Creador gráfico | ✓ | ||
DataStage | Creador gráfico | ✓ | ||
Editor de panel de control | Creador gráfico | ✓ | ||
SPSS Modeler | Creador gráfico | ✓ | ✓ | ✓ |
Creador de modelos de Decision Optimization | Creador gráfico y editor de código | ✓ | ✓ | |
AutoAI | Creador automatizado | ✓ | ✓ | |
Metadata import | Creador automatizado | ✓ | ||
Enriquecimiento de metadatos | Creador automatizado | ✓ | ✓ | |
Regla de calidad de datos | Editor de código y constructor automatizado | ✓ | ||
IBM Match 360 with Watson (Beta) | Creador automatizado | ✓ | ||
Watson Pipelines | Creador gráfico | ✓ | ✓ | ✓ |
Herramientas para datos textuales
Herramientas para crear un modelo que clasifica datos textuales:
Herramienta | Editor de código | Creador gráfico | Creador automatizado |
---|---|---|---|
Editor de cuaderno de Jupyter | ✓ | ||
RStudio | ✓ | ||
SPSS Modeler | ✓ | ||
Watson Pipelines | ✓ |
Herramientas para datos de imagen
Herramientas para crear un modelo que clasifica imágenes:
Herramienta | Editor de código | Creador gráfico | Creador automatizado |
---|---|---|---|
Editor de cuaderno de Jupyter | ✓ | ||
RStudio | ✓ | ||
Watson Pipelines | ✓ |
Acceso a las herramientas
Para utilizar una herramienta, debe crear un activo específico para dicha herramienta, o abrir un activo existente para dicha herramienta. Para crear un activo, pulse Nuevo activo o Importar activos y, a continuación, elija el tipo de activo que desee. En esta tabla se muestra el tipo de activo que se debe elegir para cada herramienta.
Para utilizar esta herramienta | Elija este tipo de activo |
---|---|
Editor de cuaderno de Jupyter | Editor de cuaderno de Jupyter |
Data Refinery | Flujo de Data Refinery |
Flujos de enmascaramiento | Flujos de enmascaramiento |
DataStage | Flujo de DataStage |
Editor de panel de control | Panel de control |
SPSS Modeler | Flujo de Modeler |
Creador de modelos de Decision Optimization | Decision Optimization |
AutoAI | Experimento AutoAI |
Aprendizaje federado | Experimento de Federated Learning |
Metadata import | Metadata import |
Enriquecimiento de metadatos | Enriquecimiento de metadatos |
Reglas de calidad de datos | Regla de calidad de datos |
IBM Match 360 with Watson (Beta) | Configuración de datos maestros |
Para editar cuadernos con RStudio, pulse Iniciar IDE > RStudio.
Editor de cuaderno de Jupyter
Utilice el editor de cuaderno de Jupyter para crear un cuaderno en el que se ejecuta el código para preparar, visualizar y analizar datos, o para crear y formar un modelo.
- Servicio necesario
- Watson Studio
- Formato de los datos
- Cualquiera
- Tamaño de datos
- Cualquiera
- Cómo preparar datos, analizar datos o crear modelos
- Escriba código en Python o R, todos también con Spark.
- Incluya texto enriquecido y medios con el código.
- Trabaje con cualquier tipo de datos en la forma que desee.
- Utilice las bibliotecas y los paquetes preinstalados o instale otros de código y de IBM.
- Planificar ejecuciones del código
- Importar un cuaderno desde un archivo, un URL o la Galería.
- Comparta de forma externa copias de solo lectura del cuaderno.
- Cómo empezar
- Para crear un cuaderno, pulse Nuevo activo > Editor de cuadernos Jupyter.
- Más información
- Cargar y analizar vídeos de conjuntos de datos públicos
- Vídeos sobre cuadernos
- Cuadernos de ejemplo
- Documentación sobre cuadernos
Data Refinery
Utilice Data Refinery para preparar y visualizar datos tabulados con un editor de flujo gráfico. Puede crear y, a continuación, ejecutar un flujo de Data Refinery como un conjunto de operaciones ordenadas en los datos.
- Servicios necesarios
- Watson Studio o Watson Knowledge Catalog
- Formato de los datos
- Tabular: Avro, CSV, JSON, Microsoft Excel (formatos xls y xlsx. Primera hoja solamente, excepto para conexiones y activos de datos conectados.), Parquet, SAS con la extensión "sas7bdat" (sólo lectura), TSV (sólo lectura) o activo de datos de texto delimitado
- Relacional: Tablas en orígenes de datos relacionales
- Tamaño de datos
- Cualquiera
- Cómo preparar los datos
- Limpie, dé forma a los datos y organícelos con más de 60 operaciones.
- Guarde los datos refinados como un nuevo conjunto de datos o actualice los datos originales.
- Cree perfiles de los datos para validarlos.
- Utilice plantillas interactivas para manipular datos con operaciones de código, funciones y operadores lógicos.
- Planifique operaciones recurrentes en los datos.
- Cómo analizar los datos
- Identifique patrones, conexiones y relaciones dentro de los datos, en varios gráficos de visualización.
- Cómo empezar
- Para crear un flujo de Data Refinery , pulse Nuevo activo > Data Refinery. El mosaico Data Refinery se encuentra en la sección Constructores gráficos .
- Más información
- Documentación sobre Data refinery
- Vídeos sobre Data Refinery
- Vídeo Diseñar datos
Watson Query
Utilice Watson Query para conectar varios orígenes de datos en una única recopilación de autoequilibrio de orígenes de datos o bases de datos.
- Formato de los datos
- Relacional: Tablas en orígenes de datos relacionales
- Tamaño de datos
- Cualquiera
- Cómo preparar los datos
- Conéctese a varios orígenes de datos.
- Cree tablas virtuales.
- Cómo empezar
- Para crear tablas virtuales, pulse Datos > Data virtualization. En el menú de servicio, pulse Virtualización > Virtualizar > Tablas.
- Más información
- Documentación de Watson Query
DataStage
Utilice DataStage para preparar y visualizar datos tabulados con un editor de flujo gráfico. Puede crear y, a continuación, ejecutar un flujo de DataStage como un conjunto de operaciones ordenadas en los datos.
- Formato de los datos
- Tabulado: Avro, CSV, JSON, Parquet, TSV (solo lectura), o archivos de texto delimitados
- Relacional: Tablas en orígenes de datos relacionales
- Tamaño de datos
- Cualquiera
- Cómo preparar los datos
- Diseñar un flujo de integración de datos gráfico que genera código de Orchestrate para ejecutarlo en el motor paralelo de DataStage de alto rendimiento.
- Realizar operaciones como: Unir, Canalizar, Suma de comprobación, Fusionar, Modificar, Eliminar duplicados y Ordenar.
- Cómo empezar
- Para crear un flujo de DataStage , pulse Nuevo activo > DataStage. El mosaico DataStage se encuentra en la sección Constructores gráficos .
- Más información
- Documentación de DataStage
Editor de panel de control
Utilice el editor de panel de instrumentos para crear un conjunto de visualizaciones de resultados analíticos en un constructor gráfico.
- Servicio necesario
- Cognos Dashboard Embedded
- Formato de los datos
- Tabulado: Archivos CSV
- Relacional: Tablas en algunos orígenes de datos relacionales
- Tamaño de datos
- Cualquier tamaño
- Cómo analizar los datos
- Cree gráficos sin codificación.
- Incluya texto, soportes, páginas web, imágenes y formas en el panel de control de dashboard.: Comparta externamente paneles de control interactivos.
- Cómo empezar
- Para crear un panel de control, pulse Nuevo activo > Editor de panel de control. El mosaico Editor de panel de instrumentos se encuentra en la sección Constructores gráficos .
- Más información
- Documentación sobre paneles de control
- Vídeos sobre paneles de control
SPSS Modeler
Utilice SPSS Modeler para crear un flujo para preparar datos y crear y entrenar un modelo con un editor de flujos en un constructor gráfico.
- Servicios necesarios
- Watson Studio
- Formato de datos
- Relacional: Tablas en orígenes de datos relacionales
- Tabulados: Archivos Excel (.xls o .xlsx), archivos CSV o archivos de SPSS Statistics (.sav)
- Textual: En los archivos o tablas relacionales soportadas
- Tamaño de datos
- Cualquiera
- Cómo preparar los datos
- Utilice funciones automáticas de preparación de datos.
- Escriba sentencias SQL para manipular datos.
- Limpie, dé forma, muestre, ordene y derive datos.
- Cómo analizar los datos
- Visualice datos con más de 40 tipos de gráficos.
- Identifique el lenguaje de un campo de texto.
- Cómo crear modelos
- Cree modelos predictivos.
- Elija entre más de 40 algoritmos de modelado.
- Utilice funciones de modelado automático.
- Modele series temporales o datos geoespaciales.
- Clasifique datos textuales.
- Identifique relaciones entre conceptos en datos textuales.
- Cómo empezar
- Para crear un flujo de SPSS Modeler , pulse Nuevo activo > SPSS Modeler.
- Más información
- SPSS Modeler - Vídeo Interfaz de usuario renovada para una central de ciencia de datos empresariales
- Documentación sobre SPSS Modeler
Creador de modelos de Decision Optimization
Decision Optimization sirve para crear y ejecutar modelos de optimización en el modelador de Decision Optimization o en un cuaderno de Jupyter.
- Servicios necesarios
- Watson Studio
- Formato de datos
- Tabulado: Archivos CSV
- Tamaño de datos
- Cualquiera
- Cómo preparar los datos
- Importar datos relevantes en un escenario y editarlo.
- Cómo crear modelos
- Crear modelos de optimización de decisiones prescritivos.
- Crear, importar y editar modelos en Python DOcplex, OPL o con expresiones de lenguaje natural.
- Crear, importar y editar modelos en cuadernos.
- Cómo resolver los modelos
- Ejecutar y resolver modelos de optimización de decisiones utilizando motores CPLEX.
- Investigar y comparar soluciones para varios escenarios.
- Crear tablas, gráficos y notas para visualizar datos y soluciones para uno o más escenarios.
- Cómo empezar
- Para crear un modelo de Decision Optimization , pulse Nuevo activo > Decision Optimization, o para los cuadernos pulse Nuevo activo > Editor de cuadernos de Jupyter.
- Más información
- Vídeos sobre Decision Optimization
- Documentación sobre Decision Optimization
Herramienta AutoAI
La herramienta AutoAI sirve para analizar automáticamente los datos tabulares y generar interconexiones de modelo candidatas personalizadas para el problema de modelado predictivo.
- Servicio necesario
- Watson Machine Learning
- Formato de los datos
- Tabulado: Archivos CSV
- Tamaño de datos
- Depende del tipo de modelo. Consulte Visión general deAutoAI para obtener más detalles.
- Cómo preparar los datos
- Transforme automáticamente los datos, como por ejemplo imputar valores perdidos y transformar el texto en valores escalares.
- Cómo crear modelos
- Forme una clasificación binaria, una clasificación de varias clases o un modelo de regresión.
- Vea una infografía del árbol mostrando las secuencias de las etapas de entrenamiento de AutoAI.
- Genere un marcador de interconexiones del modelo clasificadas por puntuaciones de validación cruzada.
- Guarde una interconexión como un modelo.
- Cómo empezar
- Para crear un experimento de AutoAI , pulse Nuevo activo > AutoAI.
- Más información
- Documentación sobre AutoAI
Federated Learning
Utilice la herramienta de aprendizaje federado para entrenar un modelo común utilizando datos distribuidos. Los datos nunca se combinan ni se comparten, preservando la integridad de los datos al tiempo que se proporciona a todas las partes participantes un modelo basado en los datos agregados.
- Servicio necesario
- Watson Machine Learning
- Formato de los datos
- Cualquiera
- Tamaño de datos
- Cualquier tamaño
- Cómo crear modelos
- Seleccione una infraestructura de entrenamiento.
- Configure el modelo común.
- Configure un archivo para entrenar el modelo común.
- Haga que las partes remotas entrenen sus datos.
- Despliegue el modelo común.
- Cómo empezar
- Para crear un experimento, pulse Nuevo activo > Aprendizaje federado.
- Más información
- Documentación sobre el aprendizaje federado
Metadata import
Utilice la herramienta de importación de metadatos para descubrir e importar automáticamente metadatos técnicos y de proceso para activos de datos en un proyecto o en un catálogo.
- Servicio necesario
- Watson Knowledge Catalog
- Formato de los datos
- Cualquiera
- Tamaño de datos
- Cualquier tamaño
- Cómo preparar los datos
- Importe activos de datos desde una conexión a un origen de datos.
- Cómo empezar
- Para importar metadatos, pulse Nuevo activo > Metadata import.
- Más información
- Documentación sobre la importación de metadatos
- Vídeos sobre Watson Knowledge Catalog
Enriquecimiento de metadatos
Utilice la herramienta de enriquecimiento de metadatos para crear automáticamente perfiles de los activos de datos y analizar la calidad de los datos de un proyecto.
- Servicio necesario
- Watson Knowledge Catalog
- Formato de los datos
- Relacional y estructurado: tablas y archivos en orígenes de datos relacionales y no relacionales
- Tabla: Archivos Avro, CSV o Parquet
- Tamaño de datos
- Cualquier tamaño
- Cómo preparar y analizar datos
- Cree un perfil y analice un conjunto de selección de activos de datos de un proyecto.
- Cómo empezar
- Para enriquecer los datos, pulse Nuevo activo > Enriquecimiento de metadatos.
- Más información
- Documentación sobre el enriquecimiento de metadatos
Regla de calidad de datos
Utilice la herramienta de calidad de datos para crear reglas que analicen la calidad de los datos en un proyecto.
- Servicio necesario
- Watson Knowledge Catalog
- Formato de los datos
- Relacional y estructurado: tablas y archivos en orígenes de datos relacionales y no relacionales
- Tabla: Archivos Avro, CSV o Parquet
- Tamaño de datos
- Cualquier tamaño
- Cómo preparar y analizar datos
- Analizar la calidad de un conjunto seleccionado de activos de datos en un proyecto.
- Cómo empezar
- Para crear una regla de calidad de datos, pulse Nuevo activo > Regla de calidad de datos.
- Más información
- Documentation sobre reglas de calidad de datos
IBM Match 360 with Watson
Utilice IBM Match 360 with Watson para crear entidades de datos maestros que representan gemelos digitales de sus clientes. Modele y correlacione los datos y, a continuación, ejecute el algoritmo de coincidencia para crear entidades de datos maestros. Personalice y ajuste el algoritmo de comparación para que se ajuste a los requisitos de la organización.
- Servicios necesarios
- IBM Match 360 with Watson IBM Watson Knowledge Catalog
- Tamaño de datos
- Hasta 1.000.000 registros (para el plan Beta Lite)
- Cómo preparar los datos
- Modele y correlacione datos de orígenes en su organización.
- Ejecute el algoritmo de coincidencia personalizable para crear entidades de datos maestros.
- Vea y edite entidades de datos maestros y sus registros asociados.
- Cómo empezar
- Para crear un activo de configuración IBM Match 360 , pulse Nuevo activo > Configuración de datos maestros.
- Más información
- Documentación sobre IBM Match 360 con Watson
IDE de RStudio
Utilice el IDE de RStudio para analizar datos o crear aplicaciones de Shiny escribiendo código R.
- Servicio necesario
- Watson Studio
- Formato de los datos
- Cualquiera
- Tamaño de datos
- Cualquier tamaño
- Cómo preparar datos, analizar datos y crear modelos
- Escriba código en R.
- Cree aplicaciones Shiny.
- Utilice bibliotecas y paquetes de código abierto.
- Incluya texto enriquecido y medios con el código.
- Prepare datos.
- Visualice datos.
- Descubra información a partir de los datos.
- Cree y entrene un modelo utilizando bibliotecas de código abierto.
- Comparta su aplicación Shiny en un repositorio Git.
- Cómo empezar
- Para utilizar RStudio, pulse Iniciar IDE > RStudio.
- Más información
- Documentación sobre RStudio
- Vídeo Visión general de IDE de RStudio
- Vídeos sobre RStudio
Flujos de enmascaramiento
Utilice la herramienta de flujo de enmascaramiento para preparar copias enmascaradas o subconjuntos enmascarados de datos del catálogo. Se elimina la identificación de los datos utilizando opciones de enmascaramiento avanzadas con reglas de protección de datos.
- Servicio necesario
- Watson Knowledge Catalog
- Formato de los datos
- Relacional: Tablas en orígenes de datos relacionales
- Tamaño de datos
- Cualquier tamaño
- Cómo preparar datos, analizar datos o crear modelos
- Importe activos de datos del catálogo gobernado al proyecto.
- Cree definiciones de trabajo de flujo de enmascaramiento para especificar qué datos se deben enmascarar con las reglas de protección de datos.
- Opcionalmente, cree un subconjunto de datos para reducir el tamaño de los datos copiados.
- Ejecute los trabajos de flujo de enmascaramiento para cargar las copias enmascaradas en conexiones de base de datos de destino.
- Cómo empezar
- Asegúrese de que se han completado los pasos previos necesarios en Watson Knowledge Catalog. Para privatizar los datos, realice una de las siguientes tareas:
- Pulse Nuevo activo > Flujo de enmascaramiento.
- Pulse en las opciones de menú de los activos de datos individuales para enmascarar directamente ese activo.
- Más información
- Documentación sobre cómo enmascarar datos
Watson Pipelines
Utilice el editor de lienzo de interconexiones para crear un flujo para preparar, visualizar y analizar datos, o para crear y entrenar un modelo.
- Formato de los datos
- Cualquiera
- Tamaño de datos
- Cualquiera
- Cómo preparar datos, analizar datos o crear modelos
- Utilice una variedad de nodos que cada uno contenga sus propios registros.
- Incorpore cuadernos en el flujo para ejecutar cualquier Python o código R.
- Trabaje con cualquier tipo de datos en la forma que desee.
- Planifique las ejecuciones del flujo.
- Importe datos de la PVC montada, el proyecto o ingiera datos de Github.
- Cree el componente personalizado con un código Python .
- Condicionalice las interconexiones para supervisar la calidad de los datos como desee.
- Utilice webhook para enviar correos electrónicos o mensajes para mantenerse al día sobre el estado de su flujo.
- Cómo empezar
- Para crear un nuevo conducto, pulse Nuevo activo > Interconexiones.
Visualizaciones de datos
Utilice las visualizaciones de datos para descubrir información a partir de sus datos. Al explorar datos desde diferentes perspectivas con visualizaciones, puede identificar patrones, conexiones y relaciones dentro de esos datos y comprender rápidamente grandes cantidades de información.
- Formato de los datos
- Tabular: archivos Avro, CSV, JSON, Parquet, TSV, SAV, Microsoft Excel .xls y .xlsx, SAS, archivos de texto delimitados y datos conectados. Para obtener más información sobre los orígenes de datos soportados, consulte Conectores.
- Tamaño de datos
- Sin límite
- Cómo empezar
- Para crear una visualización, pulse Activo de datos en la lista de tipos de activos del proyecto y seleccione un activo de datos. Pulse la pestaña Visualización y elija un tipo de gráfico.
- Más información
- Visualización de los datos
Tema padre: Proyectos