NOMBRE: PATRICIA LÓPEZ GORDILLO
LIC. PEDAGOGÍA
7° SEMESTRE GRUPO A
ESTADÍSTICOS DE TENDENCIA CENTRAL
Las
medidas de tendencia central son medidas estadísticas que pretenden resumir en
un solo valor a un conjunto de valores. Representan un centro en torno al cual
se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central
más utilizadas son: media, mediana y moda. Las medidas de dispersión en
cambio miden el grado de dispersión de los valores de la variable. Dicho en
otros términos las medidas de dispersión pretenden evaluar en qué medida los
datos difieren entre sí. De esta forma, ambos tipos de medidas usadas en
conjunto permiten describir un conjunto de datos entregando información acerca
de su posición y su dispersión.
La medida de tendencia central más conocida y utilizada es la
media aritmética o promedio aritmético. Se representa por la letra griega µ
cuando se trata del promedio del universo o población y por Ȳ (léase Y barra)
cuando se trata del promedio de la muestra. Es importante destacar que µ es una
cantidad fija mientras que el promedio de la muestra es variable puesto que
diferentes muestras extraídas de la misma población tienden a tener diferentes
medias. La media se expresa en la misma unidad que los datos originales:
centímetros, horas, gramos, etc.
Muestra
el promedio aritmético; la suma dividida por el número de casos. La media
muestral de una variable X es la suma de los valores de todas las observaciones
de esa variable (el sumatorio Ʃ) dividida entre el tamaño de la muestra: x=
Ʃ(xi) / N. A veces el sumatorio se calcula a partir de una tabla de
frecuencias, multiplicando cada valor por su frecuencia absoluta, para después
sumarlos.
Otra medida de tendencia central es la mediana. La mediana es
el valor de la variable que ocupa la posición central, cuando los datos se
disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene
valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o
superiores a la mediana.
Valor por encima y por debajo del cual se encuentran la mitad de los casos; el
percentil 50. Cuando el número de observaciones es par, la mediana es el
promedio de las dos observaciones centrales, una vez que han sido ordenadas de
manera ascendente o descendente. La mediana es una medida de tendencia central
que no es sensible a los valores atípicos (a diferencia de la media, que puede
resultar afectada por unos pocos valores extremadamente altos o bajos).
La moda de una distribución se define como el valor de la
variable que más se repite. En un polígono de frecuencia la moda corresponde al
valor de la variable que está bajo el punto más alto del gráfico. Una muestra
puede tener más de una moda. El valor que ocurre con mayor frecuencia.
Si varios valores comparten la mayor frecuencia de aparición, cada una de ellas
es una moda.
- ·
Suma
- La suma o total de todos los valores, a lo largo de todos los casos que no tengan
valores perdidos
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión
entregan información sobre la variación de la variable. Pretenden resumir en un
solo valor la dispersión que tiene un conjunto de datos. Las medidas de
dispersión más utilizadas son: Rango de variación, Varianza, Desviación
estándar, Coeficiente de variación.
Se define como la
diferencia entre el mayor valor de la variable y el menor valor de la variable.
La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz
cuadrada, la desviación estándar. La varianza se representa con el símbolo σ²
(sigma cuadrado) para el universo o población y con el símbolo s2 (s cuadrado),
cuando se trata de la muestra. La desviación estándar, que es la raíz cuadrada
de la varianza, se representa por σ (sigma) cuando pertenece al universo o
población y por “s”, cuando pertenece a la muestra. σ² y σ son parámetros,
constantes para una población particular; s2 y s son estadígrafos, valores que
cambian de muestra en muestra dentro de una misma población. La varianza se
expresa en unidades de variable al cuadrado y la desviación estándar
simplemente en unidades de variable.
- ·
Coeficiente
de variación
Es una medida de la dispersión relativa
de los datos. Se define como la desviación estándar de la muestra expresada
como porcentaje de la media muestral. Es de particular utilidad para comparar
la dispersión entre variables con distintas unidades de medida. Esto porque el
coeficiente de variación, a diferencia de la desviación estándar, es independiente
de la unidad de medida de la variable de estudio.
- · La desviación estándar
o desviación típica
Es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de
desviación. La desviación estándar se representa por σ.
Nos devuelve el valor mínimo de un
conjunto de valores. Los argumentos de la función MIN pueden ser los números,
las celdas o los rangos que contienen los valores que deseamos evaluar.
En Excel es de gran ayuda
siempre que necesitemos obtener el valor máximo de un conjunto de valores que
puede ser una lista de números ubicados en uno o varios rangos de nuestra hoja
de Excel.
- ·
Media de error estándar
Mide el error aleatorio en un dato estadístico informado: el
tipo de error causado por la variación aleatoria del muestreo al repetir una
prueba en las mismas condiciones. La incertidumbre es un concepto más amplio
que incluye componentes adicionales de error potencial además del error
aleatorio. La norma E2655 de ASTM, Guía para informar la incertidumbre de los
resultados de pruebas y Uso del término incertidumbre de la medición en métodos
de prueba de ASTM, describe el uso del concepto de incertidumbre tal como se lo
aplica al resultado de una prueba.
El
error estándar de la media (EE de la media) estima la variabilidad entre las
medias de las muestras que se obtendría si se tomaran múltiples muestras de la
misma población. El error estándar de la media estima la variabilidad entre las
muestras mientras que la desviación estándar mide la variabilidad dentro de una
muestra.
MEDIDAS DE DISTRIBUCIÓN
Las medidas de distribución nos permiten
identificar la forma en que se separan o aglomeran los valores de acuerdo a su
representación gráfica. Estas medidas describen la manera como los datos
tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la información. Su
utilidad radica en la posibilidad de identificar las características de la distribución sin necesidad de
generar el gráfico. Sus principales medidas son la Asimetría y la Curtosis.
Esta medida nos permite identificar si los datos se
distribuyen de forma uniforme alrededor del punto central (Media aritmética).
La asimetría presenta tres estados diferentes
[Fig.5-1], cada uno de los cuales define de forma concisa como están
distribuidos los datos respecto al eje de asimetría. Se dice que la asimetría
es positiva cuando la
mayoría de los datos se encuentran por encima del valor de la media aritmética,
la curva es Simétrica cuando se distribuyen aproximadamente
la misma cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando la mayor cantidad de datos se
aglomeran en los valores menores que la media.
Esta medida determina
el grado de concentración que presentan los valores en la región central de la
distribución. Por medio del Coeficiente de Curtosis,
podemos identificar si existe una gran concentración de valores (Leptocúrtica), una
concentración normal (Mesocúrtica)
ó una baja concentración (Platicúrtica).
REFERENCIAS
RECUPERADO DE:
·
http://www.uv.es/innomide/spss/SPSS/SPSS_0402a.pdf
·
http://support.minitab.com/es-mx/minitab/17/topic-library/basic-statistics-and-graphs/hypothesis-tests/tests-of-means/what-is-the-standard-error-of-the-mean/