Una de las funciones más potentes de ' watsonx.ai Studio ' es la posibilidad de modificar los valores de los datos y derivar nuevos campos a partir de datos existentes. Durante proyectos minería de datos de larga duración, es común realizar varias derivaciones, como extraer un ID de cliente a partir de una cadena de datos del registro Web o crear un valor de por vida de clientes basado en los datos demográficos y de transacción. Todas estas transformaciones pueden realizarse, utilizando diversos nodos de operaciones con campos.
- El nodo Derivar modifica los valores de datos o crea campos nuevos desde uno o más campos existentes. Crea campos del tipo fórmula, marca, nominal, estado, recuento y condicional.
- El nodo Reclasificar transforma un conjunto de valores categóricos en otro. La reclasificación es útil para contraer categorías o reagrupar datos para su análisis.
- El nodo Intervalos crea automáticamente nuevos campos nominales (conjunto) en función de los valores de uno o más campos continuos (rango numérico) existentes. Por ejemplo, puede transformar un campo de ingresos continuo en un campo categórico nuevo que contenga grupos de ingresos como desviaciones desde la media. Después de crear intervalos para el nuevo campo, puede generar un nodo Derivar basado en los puntos de corte.
- El nodo Marcas deriva varios campos de marcas en función de los valores categóricos definidos para uno o más campos nominales.
- El nodo Reestructurar convierte un campo nominal o marca en un grupo de campos que se puede rellenar con los valores todavía de otro campo. Por ejemplo, dado un campo denominado
payment type
, con valores decredit
,cash
ydebit
, se crearían tres campos nuevos (credit
,cash
,debit
), cada uno de los cuales podría contener el valor del pago real realizado.
Utilización del nodo Derivar
Al utilizar el nodo Derivar, puede crear seis tipos de campos nuevos desde uno o más campos existentes:
- Fórmula. El nuevo campo es el resultado de una expresión CLEM arbitraria.
- Marca. El campo nuevo es una marca que representa una condición especificada.
- Nominal. El campo nuevo es nominal, lo cual supone que sus miembros conforman un grupo de valores especificados.
- Estado. El campo nuevo es uno de dos estados. El cambio entre estos estados los desencadena una condición especificada.
- Recuento. El campo nuevo está basado en el número de veces que una condición es verdadera.
- Condicional. El campo nuevo es el valor de una de las dos expresiones, dependiendo del valor de una condición.
Cada uno de estos nodos contiene un conjunto de opciones especiales. Estas opciones se describen en los siguientes temas.
- Ejecución en una base de datos mediante retrotracción de SQL
- Ejecución a través de Analytic Server remoto
- Utilización de funciones que se ejecutan en Analytic Server incorporado
- Derivación de una lista
- Llamada a funciones espaciales