Por Nick Jones, Joseph Yose y Claire Beswick

Si no se es programador, puede parecer desalentador intentar utilizar análisis predictivo para identificar qué causa las fallas de un proceso.

¡Estamos a punto de mostrar que esto no tiene por qué ser así! Se trata de un segundo artículo sobre formas fáciles de usar lenguajes de programación, con la ayuda de las integraciones de Minitab con R y Python.

En este artículo vamos a explorar cómo construir una red neuronal en Minitab usando R para complementar y comparar con los resultados de nuestro propio módulo de análisis predictivo.

¿QUÉ ES R?

R es un lenguaje de programación de código abierto que se puede utilizar para ejecutar una serie de tareas relacionadas con datos, como la transformación, el modelado y la visualización de datos. R tiene un catálogo de bibliotecas para análisis de datos y estadísticas, así como algoritmos de aprendizaje automático, aunque depende de la capacidad del usuario para comprender la sintaxis.

¿POR QUÉ INTEGRAR R CON MINITAB?

Minitab Statistical Software es la herramienta de referencia para los profesionales que intentan reducir los defectos. Proporciona análisis estadísticos y predictivos en una interfaz fácil de usar.

A través de la integración de Minitab Statistical Software, se pueden utilizar scripts R que pueden ser extremadamente potentes. Esto simplifica el proceso de lo que a menudo es difícil de implementar para los programadores que no son de R. Nuestra integración permite el acceso a los scripts R a una gama más amplia de personas, multiplicando los beneficios que pueden generar.

La aplicación de escritorio de Minitab Statistical Software ofrece un paquete personalizado para la integración de R, llamado mtbr. Puede obtener más información de la integración de Python y R con Minitab Statistical Software aquí.

Cómo usar el lenguaje de programación R para construir redes neuronales en Minitab

El escenario:

Susan es una ingeniera de calidad que trabaja en una empresa de fabricación de piezas. Han estado experimentando problemas de calidad con uno de sus productos recientemente, con muchos lotes fallidos que han provocado un aumento de los costes y una acumulación de pedidos.

El reto:

La tarea de Susan es encontrar formas de reducir la tasa de defectos de los procesos. Afortunadamente, tiene datos sobre los parámetros de producción y si cada lote pasó o falló.

La idea de Susan es utilizar el análisis predictivo para tratar de comprender:

  1. ¿Qué parámetros de producción influyen en la posibilidad de un lote defectuoso?
  2. ¿A qué nivel necesitan mantener estos parámetros para minimizar la posibilidad de un lote fallido?

Quiere probar una variedad de modelos de análisis predictivo para encontrar el que mejor se adapte a sus datos.

Afortunadamente, Susan tiene la opción de modelos de regresión y CART® en su Minitab Statistical Software, así como los modelos Random Forests® y TreeNet® que se ofrecen en el complemento Predictive Analytics.

LA BOLA CURVA

¡No tan rápido Susana! Su jefe ha oído hablar de las redes neuronales y quiere intentar usarlas, pero eso no es parte de Minitab; afortunadamente, R puede construir redes neuronales.

Dado que Susan no es una usuaria de R experimentada, afortunadamente puede ejecutar el script de R dentro de la integración de R de Minitab. Esto proporcionará varias ventajas.

La integración R de Minitab facilitará todo el proceso al mantener todos los datos y resultados en Minitab.

En lugar de ejecutar sus análisis por separado en dos programas diferentes, Susan puede ejecutar todo en Minitab y comparar fácilmente el rendimiento y los resultados de los diferentes modelos.

A partir de ahí, Susan puede armar fácilmente una presentación para su gerente al exportar todos los resultados de Minitab (tablas, gráficos, etc.) a una presentación de PowerPoint.

Tutorial: Realización del análisis

Entonces, ¿cómo lleva a cabo Susan su análisis con la integración R y Predictive Analytics de Minitab?

Primero, carga los datos en Minitab. Su empresa utiliza Minitab Connect para recopilar automáticamente los datos de producción de varias fuentes de datos, por lo que puede cargar fácilmente estos datos en Minitab.

Una vez que los datos se han cargado en Minitab, ¡está lista para comenzar! Primero, echemos un vistazo a los datos.

La idea es utilizar los datos en las columnas C1 a C8 para comprender si un lote fallará o no (las columnas Defects igual a 1). Ella utilizará los modelos disponibles en Minitab.

Para hacer esto, elige el aprendizaje automático automatizado de Minitab®. Esto utilizará todos los modelos de Minitab en el conjunto de datos y luego seleccionará el que mejor se vaya, ahorrando mucho tiempo.

Los mejores modelos disponibles en Minitab son los modelos Random Forests y TreeNet. El modelo TreeNet tiene la mejor tasa de clasificación errónea, 0,8% (0,008), lo que significa que solo el 0,8% de sus predicciones sobre si un lote pasará o fallará son incorrectas. Susan elige el modelo TreeNet porque proporciona resultados más útiles e informativos que Random Forests.

A continuación, es hora de ajustar una red neuronal en R mediante la integración R de Minitab. Aquí hay una muestra del script.

Como parte de la salida, podemos visualizar la red neuronal.

La capa de entrada de la izquierda (primera fila de nodos) recibe información de cada una de las ocho variables de entrada. Encima de cada línea están los pesos sinápticos, que influyen en la siguiente capa de la red. Hay una capa oculta formada por dos neuronas y los círculos azules representan el sesgo, que corresponde a la intersección en un modelo de regresión estándar, ¡es la capa oculta donde ocurre la magia! La neurona de salida del lado derecho representa la variable Defects.

El script se guarda como un script R (.R), para ejecutarlo dentro de Minitab usamos el comando RSCRIPT seguido del nombre del script entre comillas.

El modelo tiene un error de clasificación del 7%, que no es tan preciso como el modelo TreeNet, por lo que Susan decide usar el modelo TreeNet.

Luego, usa la salida de TreeNet para comprender qué parámetros son los más influyentes para causar un lote defectuoso. Uno de los beneficios de los modelos de Minitab es que brindan mucha información complementaria (como los gráficos a continuación) como estándar, facilitando su comprensión de lo que significa el modelo.

El O2, la tasa de producción, el cáustico y el MgSO4 parecen tener un gran efecto en la tasa de defectos. Para ayudar a mejorar las cosas, Susan debe comprender la forma en que estos parámetros tienen efecto. La salida de TreeNet puede ayudar con esto.

Entonces, ¿a qué nivel se necesita controlar estos parámetros para minimizar la posibilidad de un lote fallido?

Donde vemos valores más altos en el gráfico, hay una menor probabilidad de un lote defectuoso. Basándonos en estas gráficas, se muestra que:

  • El O2 debe mantenerse entre 20,5 y 22%
  • Las tasas de producción más bajas producen una tasa de defectos más baja
  • La cáustica debe mantenerse entre 60 y 70%
  • Los valores de MgSO4 por encima del 6% dan como resultado una menor probabilidad de falla del lote

Basándose en esto, Susan implementa planes de control para cada uno de los parámetros influyentes, para controlarlos en un área que mantiene bajas las posibilidades de un lote defectuoso.

La tasa de defectos se reduce, todos están súper felices y Susan obtiene una promoción 🤩👌

Finalmente, ¿quiere probar este análisis por si mismo?

Solicítenos los datos. Más abajo encontrará un enlace a las páginas de soporte sobre la integración de R con Minitab y un enlace a un vídeo que le guiará a través de los pasos de instalación, además de probar R en Minitab y luego ejecutar el script Neural Net R en Minitab.