Propiedades de la media aritmética demostración

ORGANIZACIÓN DE DATOS NUMÉRICOS: la tarea previa al análisis de los datos es la ordenación de los mismos. El objetivo es permitir la observación rápida, para ello se utilizan dos métodos:

  • Arreglo ordenado: es la secuencia ordenada que se obtiene cuando se ordenan las observaciones de menor a mayor. Cuando los datos están ordenados es más sencillo localizar los extremos, valores típicos y concentración de valores.
  • Diagrama de tallo y hoja: es una forma rápida de mostrar la distribución de un conjunto de datos con un número relativamente pequeño de unidades. Tiene la ventaja de retener los valores reales de las variables.

GRÁFICO DE SECTORES CIRCULARES: muestra la distribución de una variable cualitativa, divide al círculo en porciones o sectores circulares correspondientes a las categorías o modalidades de la variable, de modo que el tamaño de cada porción (o el ángulo) es proporcional al porcentaje de ítems en esa categoría.

GRÁFICO DE BARRAS: muestra la distribución de una variable cualitativa, listando las categorías de la variable a lo largo de un eje y dibujando una barra según cada categoría con una altura (longitud)
igual al porcentaje de ítems de esa categoría. Las barras deben ser de  igual ancho.

HISTOGRAMA: se usa cuando la cantidad de datos es grande, muestra la distribución de una variable a través de la frecuencia o porcentaje del total de valores que hay en todo el rango de variación. Se divide el rango de los datos en clases o intervalos de igual amplitud, se cuenta el número de observaciones que caen en cada clase (frecuencia), se dibuja un eje horizontal y se marcan las clases sobre él, en el eje vertical se marca la frecuencia, la proporción o el porcentaje y se dibuja una barra vertical sobre cada clase con la altura igual a la frecuencia, proporción o porcentaje.

POLÍGONOS: al igual que el histograma, la variable se coloca en el eje horizontal y el eje vertical representa el número, la proporción o el porcentaje de las observaciones en cada clase. El eje vertical debe indicar el origen o cero verdadero, sin embargo no es necesario que el eje horizontal especifique el cero del fenómeno de interés.

POLÍGONO ACUMULATIVO (OJIVA): es la representación gráfica de una tabla de distribución acumulada. En el eje horizontal se localizan los límites superiores de cada clase y el eje vertical representa el número, la proporción o el porcentaje de observaciones acumuladas.

PROMEDIO: es la media aritmética de los valores. La media aritmética de un conjunto de n observaciones es simplemente la suma de las observaciones dividida por el número de observaciones (n).

PROPIEDADES DE LA MEDIA ARITMÉTICA

  • Es única para un conjunto de datos. Es un valor que está comprendido en el campo de variación de la variable entre Xmín y Xmáx.
  • Cada observación en el conjunto de datos es tomada en cuenta cuando se calcula la media aritmética.
  • Se mide en la misma unidad que la variable que le dio origen.
  • La media aritmética de una constante es igual a la constante misma.
  • La media aritmética del producto de una constante por una variable es igual al producto de la constante por la media aritmética de la variable.
  • La suma de los desvíos de cada uno de los valores de la variable respecto a X es igual a 0.
  • La suma de los desvíos al cuadrado con relación a la media aritmética es un mínimo.

DESVENTAJAS

  • Puede verse afectada por valores extremos que no son representativos del resto de los datos.
  • No se puede calcular la media aritmética para un conjunto de datos que tienen clases abiertas en los extremos ya sea en la parte de arriba o de debajo de la escala.

RANGO MEDIO: se usa cuando se manejan datos en que es difícil que aparezcan valores extremos. Debe utilizarse con cuidado ya que tiene en cuenta sólo la observación más pequeña y la más grande.

MEDIANA: es una mediana de posición que aparece en el medio de una sucesión ordenada de valores. Divide la distribución en dos partes iguales.

MODO: es el valor de la variable al cual le corresponde la máxima frecuencia.

MEDIDAD DE DISPERSIÓN O VARIABILIDAD: la dispersión es la cantidad de variación o diseminación en los datos. Dos conjuntos de datos pueden diferir tanto en tendencia central como en dispersión, o pueden tener las mismas medidas de tendencia central (promedio), pero grandes diferencias en términos de dispersión.

RANGO: mide la dispersión total en un conjunto de datos.

VARIANCIA: es la media aritmética de los cuadrados de los desvíos de cada observación respecto a su media.

DESVÍO ESTÁNDAR: comúnmente llamado dispersión, mide en promedio cómo las observaciones se acercan o se alejan de la media aritmética.

COEFICIENTE DE VARIACIÓN:

Cuando deseamos comparar la variabilidad de dos conjuntos de datos hay que tener en cuenta las siguientes cuestiones: las medias aritméticas de ambos conjuntos y las unidades en que están expresadas.

Es una razón independiente de las unidades de medida y da el porcentaje de la media representado por el desvío.

Si la unidad de medida de los dos conjuntos de datos es la misma y sus promedios son aproximadamente iguales es correcta una comparación directa entre las dispersiones de cada grupo. Pero tal comparación no tiene sentido si las unidades de medida son distintas o cuando siento las unidades las mismas, los promedios son significativamente distintos. Para estos casos es necesaria una unidad de medida de dispersión relativa (cociente entre una medida de dispersión y el promedio con respecto al cual las desviaciones fueron consideradas).