nombre | formula | |
---|---|---|
media | ||
varianza | ||
desviación típica | ||
coeficiente de variación | ||
centro de gravedad | ||
covarianza | ||
coeficiente de correlación | ||
pendiente | ||
recta de regresión |
Centralización:
– media: se calcula sumando los datos y dividiendo entre el tamaño de la muestra (entre el número de datos)
– moda: es el valor de la variable que tiene mayor frecuencia en la muestra es decir el que mas se repite.
– mediana: es el valor deque esta en el centro de la distribución, es decir, el valor que supera a la mitad de los de la muestra.
Dispersión:
– rango: es la diferencia entre el valor máximo y mínimo de la muestra.
– varianza: es la media aritmética de los cuadrados de las desviaciones.
– desviación típica: es la raíz cuadra de la varianza.
Parámetros de posición:
– cuartiles: que definen las cuartas partes de la muestra, mediante 3 cortes
– deciles: que dan nueve cortes para definir de diez en diez por ciento los valores de la distribución.
– percentiles: que son como los deciles pero de uno en uno porciento. Y por tanto son 99
El coeficiente de variación es la relación entre la desviación típica de una muestra y su media. El coeficiente de variación se suele expresar en porcentajes: El coeficiente de variación permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas.
CONCEPTOS:
Individuo
Elemento o ente que sea portador de información sobre alguna propiedad en la cual se está interesado.
Población
Conjunto de todos los individuos en los que se desea estudiar alguna propiedad o carácterística
Muestra es todo subconjunto finito de la población sobre el que se realice el estudio de la propiedad deseada.
Al número de individuos de este subconjunto se le llama tamaño de la muestra.
VARIABLES
CUALITATIVA:
Ees aquella que no su respues no es un número, si no una cualidad o atributo
– Ordinales: grave, moderado, leve.
– puras: no tienen un orden natural establecido
– dicotómicas: si o no
Representación
Diagrama de barras (separadas) , diagrama circular o por pictogramas. con los puntos encima de las brras eso se llama poligonal de frecuncia.
CUANTITATIVA
Es aquella que se expresa mediante números.
– continuas: si los resutados pueden tomar cualquier valor real de un cierto intervalo.
– discretas: si solo puede tomar ciertos valores.
representación: diagrama de barras separas (si son intervalos) o juntas si son valores aislados.
VARIABLES ESTADÍTICAS:
–
Los carácteres estadíticos de una población son las propiedades o cualidades de los individuos que nos interesa estudiar.
– Variable estadítica: a la aplicación que a cada modalidad le hace corresponder ese número, es decir, su medida.
– Frecuencia absoluta: fi : nº de individuos que toman un determinado valor de una variable estadítica
– Frecuencia absoluta acumulada Fi de un valor a la suma de las frecuencias absolutas de todos los valores menores o iguales que el.
– frecuencia relativa: hi : es la frecuancia absoluta entre el número de datos
– frecuancia relativa acumulada: HI : de un valor de una variable estadística a la suma de las frecuancias relativas de todos los valores menores o iguales que el
– Tablas estadísticas
Consisten en masas esrtucturadas de datos. Para la construcción de tablas de datos cuantitativos pueden tratarse éstos individualmente o agrupándolos en clases.
Estadística BIDIMENSIONAL
Si analizamos cualquier ejemplos vemos que tienen dos varibles estadísticas bidimensionales. Se representan por el par (x,y) donde x es una varible unidimensional que toma los valores, x: x1, x2, x3… e y es otra variable unidimensional con sus valores correspondientes y: y1, y2, y3….
Por lo tanto la variable estadística toma los valores (x,y): (x1,y1), (x2,y2)… A todo esto se le denomina distribución bidimensional.
Si representamos los pares de valores de las variables en un sistema de ejes cartesianos, se obtiene un conjunto de puntos soble el plano que se denomina diagrama de dispersión o nube de puntos.
Con la nube de puntos se puede deducir si la relación entre las dos variables es fuerte o débil y positiva o negativa. O también se puede dar el caso que los puntos estén alineados, es ese caso se llamara relación funcional.
Correlación
Indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables estadísticas. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación entre ellas si al disminuir los valores de A lo hacen también los de B y viceversa.
– Fuerte : grado de dependencia alto.
– Débil: grado de dependencia bajo.
– Nula: cuando no existe correlación y la denominamos incorreladas.
Covarianza:
es un valor que indica el grado de variación conjunta de dos variables aleatorias respecto a sus medias
es un número del que podemos deducir
1. Su signo indica el sentido de la correlación.
2. Un valor grande de la covarianza adbierte que la correlaccion puede ser fuerte
Coeficiente de correlación lineal:
es el criterio para medir la fuerza de la correlación.
Propiedades del coeficiente de correlación:
– el valor de “r ” no cambia al cambiar la escala de medición, es decir no tiene dimensiones.
– el signo de “r” es el mismo que el de la covarianza, y por lo tanto:
r>0 correlación directa
r< correlación=”” inversa,=””>
– -1 ≤ r ≥ 1
– si “r” toma valores cercanos a -1 la correlación es fuerte e inversa
– si “r” toma valores cercanos a 1 la correlación es fuerte e directa,
– si “r” toma valores cercanos a 0 la correlación es débil.
– /r/ si ocurre esto la correlación es perfecta, es decir es una relación funcional. Hay dependecia lineal.
– si “r” es 0 sera incorrelada o lo que es lo mismo no existe correlación.
RECTA DE Regresión:
* Método DE LOS Mínimos CUADRADOS
La recta de regresión es la que mejor se ajusta a la nube de puntos . Es una recta ideal, que asignaría a cada valor de Xi de la variable x el promedio de las yy correspondiente a la variable y.
la recta de regresión siempre pasa por el centro de gravedad.
si entre las dos variables existe una fuerte correlación, la nube de puntos se considera entorno a la recta ideal.
el método mas utilizado es el llamado mínimos cuadrados. Consiste en hacer mínima la suma de los cuadrados de las distancias (di), entre los puntos de la distribución y la recta. –
la recta que obtendremos se llama recta de regresión de “yx”
a partir de la recta de regresión podemos hacer estimaciones de los valores esperados para la variable y sustituyendo en la ecuación los valores de x. Lo denotaremos : y (xo)
La fiabilididad de las estimaciones hechas a partir de la recta de regresión dependen fundamentalmete de:
1º el valor de r: una correlación alta asegura estimaciones fiables.
2º el numero de datos considerados: la fiabilidad aumenta al aumentar el numero de datos.
3º la proximidad de valor xo . Si dicho valor es próximo a la media y no se aleja demasiado de los valores de la distribución, la estimación es fiable.