En cualquier momento después de haber añadido datos a Data Refinert, puede validar los datos. Por lo general, querrá hacer esto en varios puntos en el proceso de refinamiento.
Para validar los datos:
Desde Data Refinery, pulse la pestaña Perfil.
Revise las métricas para cada columna.
Tome las acciones adecuadas, tal como se describe en las secciones siguientes, en función de lo que desea aprender.
Frecuencia
Frecuencia corresponde al número de veces que se produce un valor o un valor en un rango especificado. Cada distribución de frecuencia (barra) muestra el recuento de valores exclusivos en una columna.
Revise la distribución de frecuencias para encontrar anomalías en los datos. Si desea limpiar los datos de esas anomalías, elimine simplemente los valores.
Para las columnas Integer y Date/Time, puede personalizar el número de intervalos (agrupaciones) que desea ver. En la vista predeterminada de varias columnas, el número máximo es 20. Si amplía la fila del gráfico de frecuencia, el máximo es 50.
Estadísticos
Las estadísticas son un conjunto de datos cuantitativos. Las estadísticas de cada columna muestran los valores mínimo, máximo y medio, y el número de valores exclusivos en dicha columna.
En función del tipo de datos de una columna, las estadísticas de cada columna variarán ligeramente. Por ejemplo, las estadísticas de una columna de tipo de datos de entero tienen valores mínimos, máximos y medios, mientras que las estadísticas de una columna de tipo de datos de serie tienen valores de longitud mínima, longitud máxima y longitud media.
Tema principal: Cómo refinar datos