0 / 0
Volver a la versión inglesa de la documentación
Clasificar a los clientes de telecomunicaciones
Última actualización: 11 dic 2024
Clasificar a los clientes de telecomunicaciones

Este tutorial construye un modelo de regresión logística, que es una técnica estadística para clasificar registros basándose en los valores de los campos de entrada. Es análoga a la regresión lineal pero utiliza un campo objetivo categórico en lugar de uno numérico.

Por ejemplo, supongamos que un proveedor de telecomunicaciones ha segmentado su base de clientes por patrones de uso del servicio, clasificando a los clientes en cuatro grupos. Si los datos demográficos se pueden utilizar para predecir la pertenencia a un grupo, se pueden personalizar las ofertas para cada uno de los posibles clientes.

Pruebe el tutorial

En esta guía de aprendizaje, realizará estas tareas:

Ejemplo de flujo de modelización y conjunto de datos

Este tutorial utiliza el flujo Clasificación de clientes de telecomunicaciones en el proyecto de ejemplo. El archivo de datos utilizado es telco.csv. La siguiente imagen muestra el flujo del modelador de muestra.

Figura 1. Flujo del modelador de muestras
Flujo del modelador de muestras

La siguiente imagen muestra el conjunto de datos utilizado con este flujo de modelización.

Figura 2. Muestra de datos
Muestra de datos
Este ejemplo se centra en la utilización de datos demográficos para predecir patrones de uso. El campo objetivo custcat tiene cuatro valores posibles que corresponden a los cuatro grupos de clientes, de la siguiente manera:
Tabla 1. Valores posibles para el campo objetivo
Valor Etiqueta
1 Servicio básico
2 Servicio electrónico
3 Servicio Plus
4 Servicio total

Como el objetivo tiene varias categorías, se utiliza un modelo multinomial. Si el objetivo tiene dos categorías distintas, como sí/no, verdadero/falso o cambiar/no cambiar, se puede crear un modelo binomial.

Tarea 1: Abrir el proyecto de ejemplo

El proyecto de muestra contiene varios conjuntos de datos y flujos de modelado de muestra. Si aún no tiene el proyecto de ejemplo, consulte el tema Tutoriales para crear el proyecto de ejemplo. A continuación, siga estos pasos para abrir el proyecto de ejemplo:

  1. En Cloud Pak for Data, en el menú de navegación ' Menú de navegación, seleccione Proyectos > Ver todos los proyectos.
  2. Haga clic en ProyectoSPSS Modeler.
  3. Haga clic en la pestaña Activos para ver los conjuntos de datos y los flujos del modelador.

Icono de punto de control ' Comprueba tu progreso

La siguiente imagen muestra la pestaña Activos del proyecto. Ahora está listo para trabajar con el flujo del modelador de ejemplo asociado a este tutorial.

Proyecto de ejemplo

volver a la parte superior

Tarea 2: Examinar los nodos Activo de datos, Tipo y Filtro

Clasificación de los clientes de telecomunicaciones El flujo del modelador incluye varios nodos. Siga estos pasos para examinar tres de los nodos:

  1. En la pestaña Activos, abra el flujo del modelador Clasificación de clientes de telecomunicaciones y espere a que se cargue el lienzo.
  2. Haga doble clic en el nodo telco.csv. Este nodo es un nodo de Activos de Datos que apunta al archivo telco.csv en el proyecto.
  3. Revise las propiedades del formato de archivo.
  4. Opcional: Haga clic en Vista previa de datos para ver el conjunto de datos completo.
  5. Haga doble clic en el nodo Tipo y haga clic en Leer valores. Este nodo especifica las propiedades de los campos, como el nivel de medición (el tipo de datos que contiene el campo) y la función de cada campo como objetivo o entrada en el modelado. Asegúrese de que todos los niveles de medición están ajustados correctamente. Por ejemplo, la mayoría de los campos con valores " 0.0 " y " 1.0 " pueden considerarse banderas.
    Figura 3. Niveles de medición
    Tipo Nodo, Niveles de medición

    Observe que " gender " se considera más correctamente como un campo con un conjunto de dos valores, en lugar de una bandera, por lo que deje su valor de medida como Nominal.
  6. Defina el rol para el campo custcat en Objetivo. Deje el rol para todos los demás campos establecido en Entrada.
  7. Haga doble clic en el nodo Filtro para ver sus propiedades.
  8. Observe que este nodo filtra sólo los campos relevantes: ' region, ' age, ' marital, ' address, ' income, ' ed, ' employ, ' retire, ' gender, ' reside, y ' custcat). Para este análisis se excluyen otros campos.

Icono de punto de control ' Comprueba tu progreso

La siguiente imagen muestra el nodo Filtro. Ahora está listo para ver el nodo Logística.

Nodo Filtrar

volver a la parte superior

Tarea 3: Visualizar el nodo Logística

Siga estos pasos para clasificar a los clientes utilizando la regresión logística multinomial:

  1. Haga doble clic en el nodo custcat (Logística ) para ver sus propiedades.
  2. En la sección Configuración del modelo, seleccione el procedimiento Multinomial.
    • Se utiliza un modelo binomial cuando el campo objetivo es una bandera o un campo nominal con dos valores discretos.
    • Se utiliza un modelo Multinomial cuando el campo objetivo es un campo nominal con más de dos valores.
  3. A continuación, seleccione el método Stepwise y el tipo de modelo Main Effects. Seleccione también la casilla Incluir constante en ecuación.
    Figura 4. Ajustes del modelo de nodo logístico
    Ajustes del modelo de nodo logístico
  4. En la sección Opciones de experto, seleccione el modo Experto.
  5. Haga clic en Salida. Seleccione Cuadro de clasificación y haga clic en Aceptar.
    Figura 5. Nodo logístico Opciones de salida
    Nodo logístico Opciones de salida

Icono de punto de control ' Comprueba tu progreso

La siguiente imagen muestra el nodo Logística. Ya está listo para navegar por el modelo.

Nodo Logística

volver a la parte superior

Tarea 4: Examinar el modelo

Siga estos pasos para examinar el modelo:

  1. Pase el ratón por encima del nodo custcat (Logística) y haga clic en el icono Ejecutar ' Icono de ejecución.
  2. En el panel Salidas y modelos, haga clic en el modelo custcat para ver los resultados.
    Figura 6. Modelo Gráfico de importancia de las características
    Modelo Gráfico de importancia de las características

A continuación, puede explorar la información del modelo, la importancia de la característica (predictor) y la información de estimaciones de parámetros.

Estos resultados se basan únicamente en los datos de entrenamiento. Para evaluar la generalización del modelo a otros datos del mundo real, puede utilizar un nodo Partición para mantener un subconjunto de registros con fines de prueba y validación.

Icono de punto de control ' Comprueba tu progreso

volver a la parte superior

Resumen

Este ejemplo muestra cómo utilizar datos demográficos para predecir patrones de uso mediante la creación de un modelo de regresión logística para clasificar registros en función de los valores de los campos de entrada.

Próximos pasos

Ahora está preparado para probar otros tutorialesSPSS® Modeler.

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información