Conjuntos de reglas utilizados por la etapa Standardize
Puede aplicar conjuntos de reglas en la etapa Standardize para crear columnas de salida coherentes, que cumplan los estándares del sector y que pueda utilizar de diversas formas para la coincidencia de datos.
- Los conjuntos de reglas de identificador de país o región leen información de área e intentan identificar el país o región asociado.
- Los conjuntos de reglas de preprocesador de dominio evalúan la entrada de dominio mixto, como el nombre de formato libre y la información de dirección, y categorizan los datos en conjuntos de columnas específicos de dominio.
- Los conjuntos de reglas específicos de dominio procesan datos de formato libre de un único dominio como, por ejemplo, el nombre, la dirección o la información de área.
- Los conjuntos de reglas de validación generan campos de informes e inteligencia empresarial, y se aplican a datos empresariales comunes como, por ejemplo, fechas, direcciones de correo electrónico y números de teléfono.
Los conjuntos de reglas proporcionados están diseñados para obtener resultados óptimos. Sin embargo, si los resultados no son satisfactorios, o si desea crear conjuntos de reglas para otros dominios de datos, puede crear un nuevo conjunto de reglas, copiar un conjunto de reglas existente o modificar un conjunto de reglas existente. Puede modificar el comportamiento del conjunto de reglas mejorando el conjunto de reglas en DataStage®, añadiendo alteraciones temporales de usuario o editando los archivos de conjunto de reglas directamente.
Normalizar el flujo de tramitación de los expedientes para EE.UU
El siguiente diagrama ilustra el flujo de procesamiento de la etapa Normalizar utilizando el preprocesador de dominio y conjuntos de reglas específicos de dominio para normalizar los registros que se encuentran habitualmente en Estados Unidos.
Dado que los archivos de entrada rara vez son específicos de un dominio, los conjuntos de reglas del preprocesador de dominios (PREP) son fundamentales a la hora de preparar un archivo para su normalización.
El mismo flujo de trabajo es representativo de otros países utilizados con la etapa Normalizar.

Uso de literales para valores requeridos
Si los registros de entrada no incluyen entradas críticas, puede insertar los valores requeridos como un literal, que aparece en la salida. El literal se inserta al añadir columnas.
Por ejemplo, los registros de entrada carecen de una entrada de estado porque todos los registros corresponden al estado de Vermont. Para incluir el estado en los registros normalizados, se insertaría el literal VT
entre el nombre de la ciudad y el código postal.
Si los registros de entrada tienen una columna de número de apartamento que sólo contiene un número de apartamento, podría insertar un literal # (almohadilla) entre el tipo de unidad y el valor de la unidad.
Los literales no pueden contener espacios y deben insertarse entre columnas. No se pueden incluir dos literales contiguos para un conjunto de reglas.
Los únicos caracteres especiales que puedes utilizar en un literal son:
- #
- Signo de la libra
- %
- porcentaje
- ^
- signo de intercalación
- &
- signo &
- <>
- Comillas angulares
- /
- barra inclinada
Para los conjuntos de reglas del preprocesador de dominios, debe insertar delimitadores de columna utilizando literales.