0 / 0
Volver a la versión inglesa de la documentación
Explorar gráficos para el tratamiento de la drogodependencia
Última actualización: 11 dic 2024
Explorar gráficos para el tratamiento de la drogodependencia
' Este tutorial proporciona un ejemplo de cómo un investigador médico puede compilar y visual para un estudio. El forense recogió datos sobre un conjunto de pacientes, todos ellos aquejados de la misma enfermedad. Durante el curso del tratamiento, cada paciente respondió a un medicamento de un total de cinco. Parte de su trabajo consiste en utilizar la minería de datos para averiguar qué medicamento es el adecuado para un futuro paciente con la misma enfermedad.

Pruebe el tutorial

En esta guía de aprendizaje, realizará estas tareas:

Ejemplo de flujo de modelización y conjunto de datos

Este tutorial utiliza el flujo Tratamiento de drogas - Gráficos exploratorios en el proyecto de ejemplo. El archivo de datos utilizado es drug1n.csv. La siguiente imagen muestra el flujo del modelador de muestra.

Figura 1. Flujo del modelador de muestras
Flujo del modelador de muestras

Los campos de datos que se utilizan en este ejemplo son:
Campo Datos Descripción
Age Edad del paciente (número)
Sex M o F
BP Presión arterial: HIGH, NORMALo LOW
Cholesterol Colesterol en sangre: NORMAL o HIGH
Na Concentración de sodio en sangre
K Concentración de potasio en sangre
Drug Medicamento prescrito al que respondió un paciente

Tarea 1: Abrir el proyecto de ejemplo

El proyecto de muestra contiene varios conjuntos de datos y flujos de modelado de muestra. Si aún no tiene el proyecto de ejemplo, consulte el tema Tutoriales para crear el proyecto de ejemplo. A continuación, siga estos pasos para abrir el proyecto de ejemplo:

  1. En Cloud Pak for Data, en el menú de navegación ' Menú de navegación, seleccione Proyectos > Ver todos los proyectos.
  2. Haga clic en ProyectoSPSS Modeler.
  3. Haga clic en la pestaña Activos para ver los conjuntos de datos y los flujos del modelador.

Icono de punto de control ' Comprueba tu progreso

La siguiente imagen muestra la pestaña Activos del proyecto. Ahora está listo para trabajar con el flujo del modelador de ejemplo asociado a este tutorial.

Proyecto de ejemplo

volver a la parte superior

Tarea 2: Examinar el activo de datos

Tratamiento de drogas - Gráficos exploratorios incluye varios nodos. Siga estos pasos para examinar el nodo Activo de datos:

  1. En la pestaña Activos, abra el flujo del modelador Tratamiento farmacológico - Gráficos exploratorios y espere a que se cargue el lienzo.
  2. Haga doble clic en el nodo drug1n.csv. Este nodo es un nodo de Activo de Datos que apunta al archivo drug1n.csv en el proyecto.
  3. Revise las propiedades del formato de archivo.
  4. Opcional: Haga clic en Vista previa de datos para ver el conjunto de datos completo.

Icono de punto de control ' Comprueba tu progreso

La siguiente imagen muestra el nodo de Activos de Datos. Ahora está listo para explorar los gráficos de distribución y auditoría de datos.

Activo de datos

volver a la parte superior

Tarea 3: Explorar los gráficos de distribución y auditoría de datos

Durante el proceso de minería de datos, resulta útil examinar los datos mediante la creación de resúmenes visuales. SPSS Modeler ofrece muchos tipos diferentes de gráficos entre los que elegir, dependiendo del tipo de datos que desee resumir. Por ejemplo, para saber qué proporción de pacientes respondió a cada fármaco, explore un nodo Tipo de fármaco (Distribución). Siga estos pasos para explorar algunos gráficos:

  1. Haga doble clic en el nodo Tipo de fármaco (Distribución ) para ver sus propiedades.
  2. Pulse Cancelar.
  3. Pase el ratón por encima del nodo Tipo de fármaco (Distribución) y haga clic en el icono Ejecutar ' .
  4. En el panel Salidas y modelos, haga clic en la salida Tipo de fármaco para ver los resultados.
Figura 2. Ver Salida: Tipo de fármaco
Ver Salida: Tipo de fármaco

El gráfico ayuda a ver la forma de los datos. Muestra que los pacientes respondieron con más frecuencia al medicamento Y y con menos frecuencia a los medicamentos B y C.

Alternativamente, puede adjuntar y ejecutar un nodo 7 Campos (Auditoría de Datos) para ver las distribuciones e histogramas de todos los campos a la vez.

  1. Haga doble clic en el nodo de salida 7 Fields (Data Audit) después del nodo Data Asset.
  2. Pase el ratón por encima del nodo 7 Campos (Auditoría de datos) y haga clic en el icono Ejecutar ' .
  3. En el panel Salidas y modelos, haga clic en la salida 7 Campos (Auditoría de datos) para ver los resultados.
Figura 3. Ver Salida: Auditoría de datos de [7 campos]
Cuadro de auditoría de datos

Icono de punto de control ' Comprueba tu progreso

La imagen siguiente muestra el flujo. Ya está preparado para crear y explorar el gráfico de dispersión.

Flujo del modelador con el panel de salidas y modelos desplegado

volver a la parte superior

Tarea 4: Crear y explorar el diagrama de dispersión

Puede ver qué factores pueden influir en ' Drug, la variable objetivo. Como investigador, sabe que las concentraciones de sodio y potasio en la sangre son factores importantes. Dado que ambas concentraciones son valores numéricos, puede crear un gráfico de dispersión de sodio frente a potasio que utilice las categorías de fármacos como superposición de colores. Siga estos pasos para crear y explorar el gráfico de dispersión:

  1. En la sección Gráficos de la paleta, arrastre el nodo Trazar al lienzo.
  2. Pasa el ratón por encima del nodo, haz clic en el botón Editar título y cámbiale el nombre a " Na v. K.
  3. Conecte el nodo Plot al nodo de activos de datos drug1n.csv.
  4. Haz doble clic en el ' Na v. K (Plot) nodo ' para editar sus propiedades.
  5. En la sección Plot, seleccione ' Na ' como campo X, ' K ' como campo Y, y en la sección Overlay, seleccione ' Drug ' como campo Color.
  6. Pulse Guardar.
  7. Pasa el ratón por encima del " Na v. K (Plot) nodo ' ' y haga clic en el icono Ejecutar ' .
  8. En el panel Salidas y modelos, haga clic en el Na v " . K salida para ver los resultados.

El gráfico muestra claramente un umbral. Para valores superiores al umbral, el medicamento " Y " es siempre el correcto. Y para valores inferiores al umbral, el fármaco ' Y ' nunca es el correcto. Este umbral es la relación entre el sodio (Na) y el potasio (K).

Icono de punto de control ' Comprueba tu progreso

La siguiente imagen muestra el diagrama de dispersión. Ya está listo para crear y explorar el gráfico web.

Diagrama de dispersión de la distribución del fármaco

volver a la parte superior

Tarea 5: Crear y explorar el gráfico web

Dado que muchos de los campos de datos son categóricos, también puede intentar trazar un gráfico web, que mapea las asociaciones entre diferentes categorías. Sigue estos pasos para explorar un gráfico web:

  1. Desde la sección Gráficos de la paleta, arrastre el nodo Web al lienzo y conéctelo al nodo de activos de datos drug1n.csv.
  2. Haga doble clic en el nodo Web para editar sus propiedades.
  3. En la sección Campos, haga clic en Añadir columnas. Seleccione las columnas " BP " (para la tensión arterial) y " Drug ".
  4. Pulse Guardar.
  5. Pase el ratón por encima del nodo Web y haga clic en el icono Ejecutar '
  6. En el panel Salidas y modelos, haga clic en la salida Web para ver los resultados.

A partir del gráfico, aparentemente el fármaco " Y " se asocia con los tres niveles de presión arterial. Este resultado no es ninguna sorpresa; ya ha determinado la situación en la que el fármaco " Y " es el mejor.

Sin embargo, si ignora el medicamento Y y se centra en los otros medicamentos, puede ver que los medicamentos A y B también están asociados a una presión sanguínea alta. Y los medicamentos C y X están asociados a una presión sanguínea baja. La presión arterial normal está asociada con el medicamento X. Sin embargo, aún no sabe cómo elegir entre los medicamentos " A " y " B " o entre los medicamentos " C y " X, para un paciente concreto. La modelización puede ayudar en este caso.

Icono de punto de control ' Comprueba tu progreso

La siguiente imagen muestra la trama web. Ya está preparado para explorar visualizaciones avanzadas.

Gráfico de malla de los medicamentos frente a la presión sanguínea

volver a la parte superior

Tarea 6: Explorar visualizaciones avanzadas

En las secciones anteriores se han utilizado distintos tipos de nodos gráficos. Otra forma de explorar los datos es con la característica de visualizaciones avanzada. Siga estos pasos para crear y explorar gráficos avanzados:

  1. Desde la sección Gráficos de la paleta, arrastre el nodo Gráficos al lienzo y conéctelo al nodo de activos de datos drug1n.csv.
  2. Haga doble clic en el nodo Gráficos para ver sus propiedades.
  3. Haga clic en el botón Launch Chart Builder.

    Aquí puede elegir y crear gráficos avanzados para explorar sus datos desde diferentes perspectivas e identificar patrones, conexiones y relaciones dentro de sus datos. Experimente creando algunos gráficos antes de volver al flujo del modelador.

Icono de punto de control ' Comprueba tu progreso

La siguiente imagen muestra un ejemplo de gráfico 3D. Ahora está listo para explorar el nodo Derive.

Visualizaciones avanzadas

volver a la parte superior

Tarea 7: Explorar el nodo Derive

Como has visto en el diagrama de dispersión de la Tarea 4, la relación entre sodio y potasio parece predecir cuándo utilizar el fármaco Y. Puede derivar un campo que contenga el valor de este ratio para cada registro. Este campo será de utilidad posteriormente cuando genere un modelo para predecir cuándo se debe utilizar cada uno de los cinco medicamentos.

Siga estos pasos para explorar el nodo Derive :

  1. Haga doble clic en el nodo Na_to_K (Derive ) para editar sus propiedades.
  2. Mira la sección Expresión. Na/K es la expresión porque se obtiene la nueva área dividiendo el valor del sodio por el valor del potasio.

    También puede crear una expresión haciendo clic en el icono de la calculadora ' Icono de ejecución para abrir el Constructor de expresiones; una forma de crear expresiones de forma interactiva utilizando listas incorporadas de funciones, operandos y campos y sus valores.
  3. Haga clic en " Cancelar " para volver a las propiedades, y haga clic de nuevo en " Cancelar " para volver al flujo.
  4. Desde la sección Gráficos de la paleta, arrastre el nodo Histograma al lienzo y conéctelo al nodo Na_to_K (Derive).
  5. Haga doble clic en el nodo Histograma para ver sus propiedades.
  6. En las propiedades del nodo Histograma, especifique Na_a_K como el campo a trazar y Drug como el campo de superposición de color.
  7. Pulse Guardar.
  8. Pase el ratón por encima del nodo Histograma y haga clic en el icono Ejecutar ' .
  9. En el panel Salidas y modelos, haga clic en la salida Histograma para ver los resultados.

Según el gráfico, se puede concluir que cuando el valor de " Na_to_K " es de 15 o más, el fármaco de elección es el " Y.

Icono de punto de control ' Comprueba tu progreso

La siguiente imagen muestra el histograma. Ahora está listo para explorar los nodos Filtro y Tipo.

Nodo Histograma

volver a la parte superior

Tarea 8: Explorar los nodos Filtro y Tipo

Explorando y manipulando los datos, podrá formular algunas hipótesis. La relación sodio-potasio en sangre parece influir en la elección del medicamento, al igual que la presión sanguínea. Sin embargo, aún no se pueden explicar todas las relaciones. La modelización puede aportar algunas respuestas. En primer lugar, siga estos pasos para explorar los nodos Filtro y Tipo:

  1. Haga doble clic en el nodo Descartar campos (filtro) para ver sus propiedades.
  2. Dado que se utiliza el campo derivado ' Na_to_K ', se filtran los campos originales ' Na y ' K ', para que no se utilicen dos veces en el algoritmo de modelado.

    Figura 4. Propiedades del nodo filter
    Propiedades del nodo filter
  3. Pulse Cancelar.
  4. Haga doble clic en el nodo Definir tipos (Tipo) para ver sus propiedades.
  5. Con el nodo Tipo, puede indicar los tipos de campos que está utilizando y cómo se utilizan para predecir los resultados. Observe que la función del campo " Drug " es Target, lo que indica que " Drug " es el campo que desea predecir. La función de los demás campos es Entrada, por lo que se utilizan como predictores.

    Figura 5. Propiedades del nodo type
    Propiedades del nodo type
  6. Pulse Cancelar.

Icono de punto de control ' Comprueba tu progreso

La imagen siguiente muestra el flujo. Ya está listo para generar el modelo.

Flujo del modelador con el panel de salidas y modelos desplegado

volver a la parte superior

Tarea 9: Generar el modelo

Siga estos pasos para generar el modelo utilizando un nodo C5.0:

  1. Pase el ratón por encima del nodo Fármaco (C5.0) y haga clic en el icono Ejecutar ' .
  2. En el panel Resultados y modelos, haga clic en el modelo de fármaco para ver los resultados.

    El diagrama de árbol muestra el conjunto de reglas que genera el nodo C5.0 0 en formato de árbol. Ahora, puedes ver las piezas que faltan del puzzle. Para las personas con una relación Na-to-K inferior a " 14.829 " e hipertensión arterial, la edad determina la elección del fármaco. Para aquellos sujetos con una presión sanguínea baja, el colesterol parece ser el mejor predictor.

    Puede pasar el puntero sobre los nodos del árbol para ver más detalles, como por ejemplo el número de casos para cada categoría de presión sanguínea y el porcentaje de confianza de los casos.

Icono de punto de control ' Comprueba tu progreso

La siguiente imagen muestra el diagrama de árbol. Ya está listo para crear un nodo de Análisis.

Salida del diagrama de árbol

volver a la parte superior

Tarea 10: Crear un nodo de análisis

Siga estos pasos para evaluar la precisión del modelo mediante un nodo de análisis:

  1. Desde la sección Salidas de la paleta, arrastre el nodo Análisis al lienzo y conéctelo a la pepita de modelo Fármaco (C5.0).
  2. Pase el ratón por encima del nodo Análisis y haga clic en el icono Ejecutar '
  3. En el panel Salidas y modelos, haga clic en la salida Análisis de [Fármaco] para ver los resultados.

    La salida del nodo Análisis muestra que con este conjunto de datos artificial, el modelo predijo correctamente la elección del fármaco para cada registro del conjunto de datos. Con un conjunto de datos real es poco probable que obtenga una precisión del 100%, pero puede utilizar el nodo Análisis para determinar si el modelo es aceptablemente preciso para su aplicación concreta.

Icono de punto de control ' Comprueba tu progreso

La siguiente imagen muestra el resultado del análisis.

Resultados de análisis

volver a la parte superior

Resumen

Este ejemplo le mostró cómo crear y explorar gráficos para el tratamiento farmacológico y utilizarlos para averiguar qué fármaco podría ser apropiado para un futuro paciente con la misma enfermedad.

Próximos pasos

Ahora está preparado para probar otros tutorialesSPSS® Modeler.

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información