Diagrama de tallos y hojas

Es un diagrama de gran utilidad para representar un conjunto de datos cuantitativos, este tipo de representación presenta similitudes con el histograma en cuanto que proporciona información del recorrido de la distribución de datos en estudio, muestra la ubicación de la mayor concentración de mediciones y revela la presencia o ausencia de simetría.

Cabe señalar que el diagrama de tallo y hojas tiene ventajas sobre el histograma, porque conserva la información que puede arrojar las mediciones individuales, situación que se pierde en los intervalos del histograma, otra ventaja, es que ésta representación elimina el paso de los datos originales a clases, lo que hace notar que se puede construir en el proceso de marcaje de los elementos en estudio. 

¿Cómo construir el diagrama de tallo y hojas?
- Señalar el título.
- Se debe dividir cada medición en dos partes, la primera se llama tallo y la segunda hojas
- El tallo se forma con uno o más dígitos iniciales de la medición, y las hojas se forman con uno o más de los dígitos restantes.
- La cantidad de tallos preferiblemente deben ser mayores o iguales a 5 y menores o iguales a 20.
- Los tallos forman una columna ordenada de menor a mayor del lado izquierdo del diagrama.
- Registrar las hojas por cada observación junto al valor correspondiente del tallo.
- Indicar fuente.

Ejemplo del diagrama de tallo y hojas:
Supongamos que durante el presente mes del año corriente, se mide el Tiempo en minutos que tardan un grupo de estudiantes para llegar a la Facultad de Medicina, Universidad de Los Andes (ULA).

Datos de Tiempo (minutos): 12, 13, 13, 14, 14, 15, 15, 20, 21, 22, 22, 22, 25, 27, 28, 29, 31, 31, 33, 34, 36, 38, 39, 40, 41, 41, 42, 44, 45, 50, 51 52.

Diagrama 1. Estudiantes de la Facultad de Medicina según Tiempo en minutos para llegar a la Facultad de Medicina. ULA, Mérida. Agosto, 2012.
Tallo   Hoja
Frecuencia absoluta
1
   2,3,3,4,4,5,57
2
   0,1,2,2,2,5,7,8,99
3
   1,1,3,4,6,8,97
4
   0,1,1,2,4,56
5
   0,1,23
Fuente: Datos supuestos.

Interpretación: a través del Diagrama 1 se puede observar que la distribución de datos de Tiempo (minutos) es asimétrica positiva, con la mayor concentración de datos en el segundo tallo, también se puede  determinar la moda, que en este caso es 22 minutos. Además se puede hallar la mediana, considerando que la cantidad de datos son pares, se tiene que los elementos centrales son 29 y 31 minutos, por lo tanto la mediana=(29+31)/2=30 minutos, es el Tiempo que divide la distribución en dos partes iguales. Asimismo se pueden calcular los cuartiles, usando Q1=n/4 y para el Q3=3n/4, por ejemplo: Q1=32/4=8, el valor obtenido determina la posición, la cual arroja que 20 minutos es el Tiempo que deja el 25% de los datos por debajo y el 75% de los datos de la distribución por encima.

Recomendaciones:
Es importante tomar en cuenta que este tipo de diagramas, no es aconsejable en informes anuales o en algún tipo de medios de difusión para un público en general, porque se convierten en una ayuda básica para que investigadores y tomadores de decisiones comprendan la naturaleza de los datos.

Algunas veces, la utilización del primero o de los dos primeros dígitos de los datos puntuales como tallos no proporcionan suficientes tallos como para permitir detectar la forma de su distribución. Una manera de solucionar esto es utilizar tallos dobles. Es decir, utilizar cada tallo dos veces: una vez para trazar las hojas inferiores y otra vez para trazar las hojas superiores.

Muchos de los procedimientos estadísticos que se desarrollan suponen que la variable independiente estudiada posea al menos una distribución aproximadamente normal, para la cual el diagrama de tallos y hojas tiene forma de campana, por lo tanto, los diagramas de tallos y hojas dan una idea de la localización de los datos y de la forma de la distribución. Esta técnica funciona bien para los conjuntos de datos que no tienen una dispersión muy grande.

Referencias:

Daniel, W. (2010). Bioestadística. Base para el análisis de las ciencias de la salud (4a. Ed.). México: Limusa Wiley.

Montgomery, D. y Runger, G. (2008). Probabilidad y estadística aplicada a la ingeniería (2a. Ed.). México: Limusa Wiley.

Entradas populares de este blog

Proporción, razón y tasa.

Medidas de tendencia no central