Análisis predictivo
La modelización predictiva utiliza la estadística para predecir resultados[1]. La mayoría de las veces, el acontecimiento que se quiere predecir está en el futuro, pero la modelización predictiva puede aplicarse a cualquier tipo de acontecimiento desconocido, independientemente del momento en que se produzca. Por ejemplo, los modelos predictivos suelen utilizarse para detectar delitos e identificar a los sospechosos, después de que el delito haya tenido lugar[2].
En muchos casos, el modelo se elige sobre la base de la teoría de la detección para tratar de adivinar la probabilidad de un resultado dada una cantidad determinada de datos de entrada, por ejemplo, dado un correo electrónico determinar la probabilidad de que sea spam.
Los modelos pueden utilizar uno o varios clasificadores para intentar determinar la probabilidad de que un conjunto de datos pertenezca a otro conjunto. Por ejemplo, un modelo puede utilizarse para determinar si un correo electrónico es spam o “ham” (no spam).
Dependiendo de los límites de la definición, la modelización predictiva es sinónimo o se solapa en gran medida con el campo del aprendizaje automático, como se denomina más comúnmente en contextos académicos o de investigación y desarrollo. Cuando se despliega comercialmente, la modelización predictiva suele denominarse análisis predictivo.
Cómo hacer un modelo de predicción
Se discute la neutralidad de este artículo. La discusión pertinente puede encontrarse en la página de discusión. Por favor, no elimine este mensaje hasta que se cumplan las condiciones para hacerlo. (Abril de 2016) (Aprende cómo y cuándo eliminar este mensaje de la plantilla)
La modelización predictiva utiliza la estadística para predecir resultados[1] La mayoría de las veces, el acontecimiento que se quiere predecir está en el futuro, pero la modelización predictiva puede aplicarse a cualquier tipo de acontecimiento desconocido, independientemente del momento en que se produzca. Por ejemplo, los modelos predictivos suelen utilizarse para detectar delitos e identificar a los sospechosos, después de que el delito haya tenido lugar[2].
En muchos casos, el modelo se elige sobre la base de la teoría de la detección para tratar de adivinar la probabilidad de un resultado dada una cantidad determinada de datos de entrada, por ejemplo, dado un correo electrónico determinar la probabilidad de que sea spam.
Los modelos pueden utilizar uno o varios clasificadores para intentar determinar la probabilidad de que un conjunto de datos pertenezca a otro conjunto. Por ejemplo, un modelo puede utilizarse para determinar si un correo electrónico es spam o “ham” (no spam).
Ejemplos de análisis predictivo
El modelado predictivo es el proceso de tomar resultados conocidos y desarrollar un modelo que pueda predecir valores para nuevos sucesos. Utiliza datos históricos para predecir eventos futuros. Hay muchos tipos diferentes de técnicas de modelización predictiva, como el ANOVA, la regresión lineal (mínimos cuadrados ordinarios), la regresión logística, la regresión de cresta, las series temporales, los árboles de decisión, las redes neuronales y muchas más. La selección de la técnica de modelización predictiva correcta al inicio del proyecto puede ahorrar mucho tiempo. La elección de una técnica de modelización incorrecta puede dar lugar a predicciones inexactas y a gráficos residuales que experimentan una varianza y/o una media no constantes.
El análisis de regresión se utiliza para predecir una variable objetivo continua a partir de una o varias variables independientes. Por lo general, el análisis de regresión se utiliza con variables que ocurren naturalmente, en lugar de variables que han sido manipuladas a través de la experimentación. Como ya se ha dicho, hay muchos tipos diferentes de regresión, así que una vez que hemos decidido que hay que utilizar el análisis de regresión, ¿cómo elegimos qué técnica de regresión hay que aplicar?
Análisis predictivo en python
El modelado predictivo es una técnica estadística comúnmente utilizada para predecir el comportamiento futuro. Las soluciones de modelado predictivo son una forma de tecnología de minería de datos que funciona analizando datos históricos y actuales y generando un modelo para ayudar a predecir resultados futuros. En el modelado predictivo, se recogen datos, se formula un modelo estadístico, se hacen predicciones y se valida (o revisa) el modelo a medida que se dispone de datos adicionales. Por ejemplo, se pueden crear modelos de riesgo para combinar la información de los afiliados de forma compleja con información demográfica y de estilo de vida procedente de fuentes externas para mejorar la precisión de la suscripción. Los modelos predictivos analizan el rendimiento pasado para evaluar la probabilidad de que un cliente muestre un comportamiento específico en el futuro. Esta categoría también abarca los modelos que buscan patrones de datos sutiles para responder a preguntas sobre el rendimiento de los clientes, como los modelos de detección de fraudes. Los modelos predictivos suelen realizar cálculos durante las transacciones en vivo, por ejemplo, para evaluar el riesgo o la oportunidad de un determinado cliente o transacción para orientar una decisión. Si las aseguradoras sanitarias pudieran predecir con exactitud las tendencias seculares (por ejemplo, la utilización), las primas se fijarían adecuadamente, los objetivos de beneficios se cumplirían con mayor coherencia y las aseguradoras sanitarias serían más competitivas en el mercado.