Utilice esta información para resolver preguntas sobre el uso de Data Refinery.
- No se pueden refinar los datos de un activo de datos Excel
- El trabajo de flujo deData Refinery falla con un activo de datos grande
No se pueden refinar los datos de un activo de datos Excel
El flujo de Data Refinery puede fallar si no puede leer los datos. Confirme el formato del archivo Excel. De forma predeterminada, la primera línea del archivo se trata como la cabecera. Puede cambiar este valor en los valores de flujo. Pulse el icono Valores de flujo . Vaya a la pestaña Conjuntos de datos de origen y pulse el icono Desbordamiento junto al origen de datos y seleccione Editar formato. También puede especificar la primera propiedad de línea, que designa qué fila es la primera fila del conjunto de datos que se va a leer. El cambio de estas propiedades afecta al modo en que se visualizan los datos en Data Refinery , así como a la ejecución del trabajo Data Refinery y a la salida del flujo.
El trabajo de flujo de Data Refinery falla con un activo de datos grande
Si el trabajo de flujo de Data Refinery falla con un activo de datos grande, intente estas sugerencias de resolución de problemas para solucionar el problema:
- En lugar de utilizar un activo de datos de proyecto como destino del flujo de Data Refinery (predeterminado), utilice el almacenamiento en la nube. Por ejemplo, IBM Cloud Object Storage, Amazon S3o Google Cloud Storage.
- Seleccione un entorno Spark & R para el trabajo de flujo Data Refinery o cree una nueva plantilla de entorno Spark & R .