El término «grados de libertad» es un concepto estadístico asociado con multitud de cálculos como pueden ser la obtención de intervalos de confianza o la realización de contrastes de hipótesis. De forma abreviada, en los programas informáticos de estadística, se utiliza la abreviatura «gl» para denominarlos o «df» (del inglés, degree freedom). Pero ¿qué significado tienen? ¿Cuál es su utilidad? ¿Cómo afectan a los resultados estadísticos un mayor o menor número de grados de libertad? Lo primero que se debe tener en cuenta es que los grados de libertad siempre van asociados a un determinado estadístico, contraste de hipótesis o intervalo de confianza y son importantes para entender los análisis estadísticos. No se puede hablar de grados de libertad sin especificar el estadístico, contraste o intervalo de confianza al que nos referimos. De forma general, los grados de libertad de un estadístico es el número de piezas independientes de información que se utilizaron para calcular dicho estadístico. Otra forma de definir los grados de libertad de un estadístico sería como el número de valores de la muestra que son libres de variar en dicha muestra para la obtención del referido estadístico. Para obtener su valor, en el caso de que queramos estimar el valor de un parámetro, es necesario restar uno al tamaño de la muestra. Por ejemplo, si deseamos estimar las ventas medias mensuales de un producto y utilizamos una muestra de 12 meses para su obtención, los grados de libertad de este estimador serían 11 (12-1=11).
Cuando tenemos que estimar un parámetro, ¿por qué se le resta uno al tamaño de la muestra? Vamos a explicarlo con un ejemplo. Suponga que está interesado en estimar la duración media de una batería de un teléfono móvil cuyo valor es igual a 7 horas. Suponga también que para realizar esta estimación ha decidido seleccionar una muestra de 3 baterías. Los valores de la muestra que permiten obtener este resultado podrían ser: 6, 9, 6 o bien 8, 9, 4 o bien 5, 8, 8. Si calcula la media de cualquiera de estos conjuntos de valores podrá comprobar que es igual a 7. Pero para cada una de estas muestras, los números que las componen no pueden variar libremente. ¿Por qué? Porque una vez que usted ha seleccionado los dos primeros valores, el tercero, es un valor fijo que no puede variar. De esta manera, si por ejemplo los dos primeros valores de una muestra fueran 6 y 10, el tercer valor irremediablemente tiene que ser 5 puesto que la única solución de la expresión (6+10+x)/3=7 es x=5. Por tanto, los grados de libertad de este conjunto de 3 datos, para obtener este estimador, es igual a 2 (tamaño de la muestra menos 1).
El número de grados de libertad no obstante depende del número de parámetros a estimar. Así, si denominamos k al número de parámetros desconocidos, el número de grados de libertad será igual al tamaño de la muestra (n) menos k.
Los grados de libertad de un estimador son el número de piezas de información que son libres de variar y de forma general se obtiene restando al número de elementos de una muestra (n), el número de parámetros (k) estimados: g.l.=n-k
El número de grados de libertad se incrementará en tanto se incremente el número de datos que componen la muestra pero se reducirá en la misma cuantía que el número de parámetros que deban ser estimados. Esta es la razón por la que los grados de libertad varían de un test estadístico a otro.
Cual tipo de distribución se utiliza cuando hay n grados de libertad?
El tipo de distribución que utilicemos depende de la variable que estemos estudiando y de los datos obtenidos para su estudio. Un saludo.