Módulo de analítica predictiva
DESCRIPCIÓN
Obtenga acceso a los algoritmos de aprendizaje automático basados en árboles, los mejores en su clase, TreeNet y Random Forests, para obtener el impulso al poder de análisis predictivo avanzado que necesita y que complementa fácilmente su suscripción de Minitab Statistical Software.
¿Qué son los métodos basados en árboles? Los algoritmos basados en árboles utilizan una serie de reglas si-entonces para crear predicciones a partir de uno o más árboles de decisión. En comparación con los modelos lineales como la regresión, los métodos basados en árboles mapean las relaciones no lineales bastante bien y pueden superar el desorden en los datos que otros métodos simplemente no pueden, al mismo tiempo que brindan no solo velocidad de respuesta, lo que puede ayudar a ahorrar tiempo, sino a una precisión notable y facilidad de interpretación.
CARACTERÍSTICAS
TreeNet® (Gradient Boosting)
La herramienta de aprendizaje automático más flexible, galardonada y potente de Minitab, TreeNet® Gradient Boosting, es capaz de generar modelos extremadamente precisos de manera consistente. |
|
Para aquellos que son nuevos en TreeNet, se trata de una potente implementación de la moderna clase de algoritmos de aprendizaje automático generalmente conocida como Potenciación del Gradiente Estocástica (Stochastic Gradient Boosting). Desarrollada por Jerome Friedman en la Universidad de Stanford, la técnica es conocida por su excelente precisión predictiva. El secreto está en la forma en que se construye un modelo: en cada iteración, se añde un pequeño árbol al conjunto actual de árboles para corregir los errores combinados del conjunto.
Utilizando la variedad de funciones de pérdida suministradas, el proceso se puede ajustar para la tarea específica de modelado predictivo, como regresión de mínimos cuadrados, regresión robusta, clasificación, etc. Para ayudar con la interpretación del modelo, TreeNet va un paso más allá y genera automáticamente varios modelos 2D y gráficos 3D para explicar la naturaleza de la dependencia de la variable de respuesta en las entradas del modelo. El modelo es lo suficientemente flexible como para descubrir e incorporar automáticamente varias no linealidades e interacciones multidireccionales. Un conjunto adicional de controles permite al usuario ajustar las interacciones del modelo para cumplir con los objetivos de diseño específicos.
Random Forests®
Basado en una colección de árboles de clasificación y regresión (CART®), el motor de modelado de Random Forests® (bosques aleatorios) suma las predicciones realizadas a partir de cada árbol CART para determinar la predicción general del bosque, al tiempo que garantiza que los árboles de decisión no se vean influenciados entre sí. |
Para los que no conozcan Random Forests, se trata de una potente técnica de conjunto desarrollada por Leo Breiman y Adele Cutler en la Universidad de California, Berkeley, y es la preferida por muchos profesionales del modelado predictivo. La engañosa simplicidad del algoritmo crea cientos de árboles independientes y emplea muchos muestreos tanto de observaciones como de variables.
La capacidad única de Random Forests para evaluar el rendimiento del modelo sin sesgo en función de los datos listos para usar elimina la necesidad de tener una muestra de prueba/validación separada. Esto posiciona inmediatamente a Random Forests como la mejor herramienta de modelado predictivo en las aplicaciones de datos amplios donde el número de variables excede, a menudo muchas veces, el número de observaciones disponibles.