Tema 6: representación de variables
Representaciones gráficas
Las representaciones gráficas de las variables son una manera rápida de comunicar información numérica, se puede decir que son la imagen de las ideas.
Completan el análisis estadístico, aumentando la información y ofreciendo una orientación visual.
No reemplaza a las medidas estadísticas que deben ser calculadas.
Encontramos una serie de normas básicas:
- Visualmente claros.
- Claramente descritos en pie de figura y en texto.
- Representa gráficamente las conclusiones del estudio.
- Hay que evitar gráficos confusos y no sobrecargarlos.
Representaciones gráficas más empleadas
- Variables cualitativas
-Gráfico de sectores. Nominales: (dicotómicas o policotómicas)
El área de cada sector circular es proporcional a la frecuencia (absoluta o relativa)de las categorías de la variable.
No usar con variables ordinales, puesto que pierden su graduación y no es recomendable para más de 3 o 4 categorías porque quedaría demasiado cargado.
Sólo muestra una variable a la vez, si se quiere hacer comparaciones se tienen que hacer dos diagramas de sectores. Por cada variable un gráfico.
Los errores son: utilizar para variables policotómicas con muchas categorías y utilizar para variables ordinales puesto que se pierde la gaduación.
-Diagramas de barras: policotómicas
Se usa también en variables cualitativas ordinales, con este tipo evitamos que se pierdan los atributos de orden o jerarquía.
Las frecuencias absolutas o relativas de todas las categorías de una variable se muestran fácilmente con este tipo de gráfico. Cada barra representa una categoría y la altura de esta la frecuencia.
Las barras deben estar separadas, porque sino sería un histograma y es importante que el eje Y empiece en la frecuencia 0.
Abajo tenemos las frecuencias y encima de las barras las frecuencias absolutas y las frecuencias relativas en porcentaje. Seria en este caso ordinal puesto que vas de más a menos estableciendo una jerarquía.
Un error en estos gráficos es comparar las frecuencias absolutas y no son comparables. Habría que comparar las frecuencias relativas.
En una variable cuantitativa es preferible un histograma, antes que este tipo de representación.
-Pictográmas: policotómicas
Es un tipo gráfico similar al diagrama de barras, pero utiliza figuras proporcionales a la frecuencia en lugar de barras.
Generalmente se emplea para representar variables cualitativas.
Este tipo de gráfico no permite buenas comparaciones, para realizar su gráfica primero se deben escoger las figuras que sean alusivas al tema y se les asigna un valor.
En caso de que una cantidad represente un valor menor, la figura aparecerá desvirtuada.
- Variables cuantitativas
-Histogramas: variables continuas
Es el más usado, ya que es el más sencillo de interpretar.
Es una sucesión de rectángulos contiguos construidos sobre una recta (pegados unos con otros).
Representa a una variable continua con sus datos agrupados en intervalos.
La base de cada rectángulo representa la amplitud de cada intervalo y la altura está determinada por la frecuencia. Cada intervalo representado en el histograma ocupa un rectángulo.
-Polígonos de frecuencia: variables continuas
Une los puntos medios de las bases superiores de los rectángulos.
Se acostumbra a prolongar el polígono hasta puntos de frecuencia cero.
Un polígono de frecuencia permite ver con gran claridad las variaciones de la frecuencia de una clase a otra.
Son muy útiles cuando se pretende comparar dos o más distribuciones.
La suma de las áreas de los rectángulos de un histograma es igual al área limitada por el polígono de frecuencia y el eje X.
El polígono de frecuencia resume, en una sola línea, el resultado del histograma correspondiente.
-Gráfico de tronco y hojas: variables contínuas
Representa las variables cuantitativas continuas.
Cada dato de la serie se divide en dos partes:
- En la primera columna se representa los tallos (el primer dígito)
- En la segunda columna las hojas (los demás dígitos)
Es un diagrama híbrido entre una tabla y una gráfica, nos muestra la forma de la distribución y los valores de la variable.
Tiene la ventaja de no perder información individual, identifica la distribución de los datos y si existen clases faltantes.
Esto hace que para muchos autores sea la representación gráfica de elección.
Cuando los números son muy grandes:
- Datos bidimensionales y multidimensionales
-Gráficos de tendencias temporáles
Sería la línea que une todos los valores de la variable que estoy midiendo a través de los años. Tiene por tanto una línea temporal.
-Diagramas de dispersión, nubes de puntos o scatter plot
Representan el comportamiento de dos variables continuas en un grupo de individuos.
En el eje x: se representa la variable independiente.
En el eje y: la variable dependiente (a la que le influye).
La imagen del diagrama nos da una idea de la correlación de las variables.
-Diagramas de estrellas: datos multidimesionales
Representar un conjunto de variables cuantitativas y comparar entre diferentes unidades de análisis (individuos/ conglomerados).
Cada variable representa un vértice del diagrama de estrella. Da una idea del comportamiento del conjunto de variables
Permite comparativas con "Gold Standard", es decir, compara con el objetivo idóneo.
Comentarios
Publicar un comentario