El histograma es una de las herramientas descriptivas básicas para la visualización de variables numéricas, como por ejemplo la longitud de una pieza, el tiempo que transcurre entre la recepción de un pedido y la entrega del mismo, la viscosidad de un producto, o los decibelios de un motor. Un histograma representa la distribución de los datos y se construye representando la escala de la variable numérica en el eje horizontal (eje x) y cortándola en intervalos iguales. Luego se cuentan cuantos valores de nuestros datos hay en cada intervalo y se representa su frecuencia en el eje vertical (eje y) en forma de barra; cuanto más alta es la barra, más frecuentes son los valores del intervalo entre nuestros datos.

¿Es lo mismo un histograma que un diagrama de barras?

Es una confusión habitual, puesto que en ambos gráficos visualizamos barras, pero no son lo mismo. En el histograma, el eje horizontal representa una variable numérica y las barras están pegadas una a la otra, es decir, al terminar una barra, que es un intervalo numérico, enseguida empieza la otra barra, que es otro intervalo numérico a continuación del anterior.

En un diagrama de barras, el eje horizontal representa generalmente categorías que, a pesar de que se puedan ordenar, no tienen una escala o métrica y por eso las barras están siempre separadas las unas de las otras.

A nivel práctico, los dos gráficos se utilizan para conocer cómo se distribuyen los datos de un conjunto de individuos; si a los individuos se les mide una característica como la altura, se utiliza un histograma, y si se les clasifica según la región de nacimiento, se utiliza un diagrama de barras. Con el histograma obtenemos una idea general de cómo se concentran las alturas de los individuos y, con el diagrama de barras, de cómo son las regiones de origen de estos individuos.

En lo que sí se parecen un histograma y un diagrama de barras es en el eje vertical, que en ambos casos representa la frecuencia (cantidad de veces que ese intervalo o categoría se observa entre los datos). La frecuencia se puede expresar en valor absoluto, es decir, mostrando el contaje o número total de valores observados, o en valor relativo, que puede ser el porcentaje o tanto por uno sobre el total.

¿Cómo se usa un histograma?

Mostramos a continuación un ejemplo real de interpretación de un histograma. El departamento de calidad quiere analizar los registros históricos de los datos de fricción de una pieza que tiene un límite de tolerancias de 4.2. Histograma del registro de datos históricos de torsión de una piezaAl realizar el histograma se obtiene el gráfico de la siguiente figura.

Se puede apreciar que hay dos bloques de valores. El bloque de la izquierda que tiene forma aproximada de campana y con valores que oscilan entre 1.9 y 2.1. Y el bloque de la derecha con casi todos los valores en 4.1 y con muy poca dispersión. Por el hecho de tener dos bloques de datos tan separados, debemos cuestionar si hay alguna variable, que de momento no consideramos, que separa en grupos la variable fricción.

Además, nos tendría que llamar la atención que el grupo de 4.1 está muy cerca del valor de tolerancias sin superarlo nunca, ya que en realidad se esperaría ver la misma forma de campana de la izquierda replicada en el grupo de 4.1 y, sin embargo, surge una única barra. Esto nos hace sospechar que los datos originales han sido modificados para “hacerlos entrar en tolerancias”.

¿QUIERE MÁS INFORMACIÓN?

Si le apetece indagar más sobre esta herramienta u otras que pueda utilizar para entender e interpretar mejor sus datos, consulte nuestro curso de Diagnóstico con visualización de datos con Minitab.