0 / 0
Volver a la versión inglesa de la documentación

Nodo Fusionar

Última actualización: 12 feb 2025
Nodo Fusionar (SPSS Modeler)

La función de un nodo Fusionar es tomar varios registros de entrada para crear un registro de salida que contenga todos o algunos de los campos de entrada. Se trata de una operación útil cuando se desean fusionar datos de diferentes orígenes, como datos de clientes internos y datos demográficos adquiridos.

Se pueden fusionar datos de los siguientes modos.

  • Fusionar por Orden concatena registros correspondientes procedentes de todos los orígenes en el orden de entrada hasta vaciar el origen de datos más pequeño. Si se usa esta opción, es importante haber ordenado previamente los datos con un nodo Ordenar.
  • Fusionar utilizando un campo Clave, como por ejemplo Customer ID, para especificar cómo hacer coincidir los registros de un origen de datos con registros de otro(s). Hay varias posibilidades de unión, incluidas la unión interior, la exterior, la exterior parcial y la anti-unión.
  • Fusionar por Condición hace que se pueda especificar una condición que ha de cumplirse para que pueda realizarse la fusión. Se puede especificar la condición directamente en el nodo, o crear la condición utilizando el generador de expresiones.

Tipos de uniones

Al utilizar un campo de clave para la fusión de datos, es posible que le resulte útil dedicar algún tiempo a pensar qué registros se excluirán y cuáles se excluirán. Hay distintas uniones, que se describen aquí. Los dos tipos básicos de uniones se conocen como interior y exterior. Estos métodos se utilizan con frecuencia para fusionar tablas de conjuntos de datos relacionados basados en valores comunes de un campo de clave, como por ejemplo Customer ID. Las uniones interiores permiten la realización de fusiones limpias y conjuntos de datos de salida que incluyen únicamente registros completos. Las uniones exteriores también incluyen registros completos procedentes de los datos fusionados, pero también permiten la inclusión de datos exclusivos procedentes de una o varias tablas de entrada.

Los tipos de uniones permitidos se describen con mayor detalle como se indica a continuación.

Unión interna ' Una unión interna sólo incluye los registros en los que un valor del campo clave es común a todas las tablas de entrada. Es decir, los registros no coincidentes no se incluirán en el conjunto de datos de salida.

Unión externa completa Una unión externa completa incluye todos los registros, coincidentes y no coincidentes, de las tablas de entrada. Las uniones externas izquierda y derecha se conocen como uniones externas parciales.

Unión externa parcial Una unión externa parcial incluye todos los registros coincidentes mediante el campo clave, así como los registros no coincidentes de las tablas especificadas. (Es decir, todos los registros de algunas etiquetas y sólo los registros coincidentes de otras.) Puede seleccionar tablas (como A y B mostradas aquí) para incluirlas en la unión externa bajo las opciones Fusionar de las propiedades del nodo. Las uniones parciales también se denominan uniones exteriores izquierdas o derechas cuando sólo se fusionan dos tablas. Puesto que SPSS Modeler permite la fusión de más de dos tablas, nos referimos a esto como una unión externa parcial.

Anti-unión ' Un anti-join incluye sólo los registros no coincidentes de la primera tabla de entrada (Tabla A mostrada aquí). Este tipo de unión es el opuesto de una unión interna y no incluye registros completos en el conjunto de datos de salida.

Por ejemplo, si tiene información acerca de las granjas de un conjunto de datos y de reclamaciones del seguro relacionadas con las granjas en otro, puede establecer una correspondencia entre los registros del primer origen de datos y los del segundo mediante la opción Correlacionar a. Para determinar si un cliente de la muestra de granjas ha rellenado una reclamación del seguro, utilice la opción de unión interior para devolver una lista que muestre dónde coinciden los ID de las dos muestras.

Figura 1. Resultado de la muestra para una fusión de unión interior
Resultado de la muestra para una fusión de unión interior

Al utilizar la opción de unión exterior completa, se obtienen tanto los registros coincidentes como los no coincidentes de las tablas de entrada. El valor perdido del sistema ($null$) se utilizará para los valores incompletos.

Figura 2. Resultado de la muestra de una fusión de unión exterior completa
Resultado de la muestra de una fusión de unión exterior completa

En una unión exterior parcial se incluyen todos los registros coincidentes por un campo clave y los registros no coincidentes procedentes de las tablas especificadas. La tabla muestra todos los registros coincidentes del campo ID así como los registros coincidentes del primer conjunto de datos.

Figura 3. Resultado de la muestra de una fusión de unión exterior parcial
Resultado de la muestra de una fusión de unión exterior parcial

Si está utilizando la opción anti-unión, la tabla sólo devuelve registros no coincidentes para la primera tabla de entrada.

Figura 4. Resultado de la muestra para una fusión anti-unión
Resultado de la muestra para una fusión anti-unión