Estudio e identificación de variables que determinan la clusterización de clientes-aplicación a datos reales
Loading...
Files
Date
2019-12-12
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
El análisis de conglomerados por variables es un procedimiento exploratorio que puede sugerir procedimientos de reducción de la dimensión, como el análisis de componentes principales. La idea es construir una matriz de distancias o similitudes entre variables y aplicar a esta matriz un algoritmo jerárquico de clasificación con el objetivo de agrupar elementos en grupos homogéneos en función de las similitudes o similaridades entre ellos, para luego aplicar los métodos de clasificación basado en árboles de decisión o bosques aleatorios los cuales estratifican o segmentan el espacio del predictor en un número simple de regiones; para ello, se parte del registro histórico de los datos reales proporcionados por cierta institución dichos datos están compuesto por las observaciones de los clientes de los últimos 4 años (2015-2018) y se busca a través del estudio identificar las variables que determinan la clusterización de clientes, analizando la influencia de las variables mediante dos enfoques importantes para la generación de modelos. Lo que se pretende con los modelos es desarrollar una estrategia de negocios, la cual consiste en generar movilidad positiva para cada uno de los clientes, mejorando su clasificación básica predefinida.
Description
Keywords
Variables, clusterización, datos reales