martes, 9 de agosto de 2011

Rango Percentil y Percentil

Rango Percentil (RP) y Percentil (P)

Rango Percentil (RP)
El rango de percentil compara un dato específico de una variable con el conjunto de datos de donde se tomó. El resultado significa el porcentaje de casos que recibió puntuaciones más bajas que quien tuvo el dato del que se calcula el Rango Percentil.
El rango percentil de un dato depende del grupo de donde se tomó.

Cálculo del Rango Percentil
Para calcular el Rango Percentil de un dato se utiliza la fórmula:
RP¿?=%aa+[(¿?-liv)/i(%)]

¿? = Dato del que se calculará el Rango Percentil
%aa = Porcentaje acumulado anterior a la clase donde se localiza el valor ¿?
Liv = Límite Inferior Verdadero
% = porcentaje de la clase donde se localiza el ¿?
i= Tamaño del intervalo

Ejemplo: Calificaciones del curso de matemáticas

Clases--- X------ f----- Fa----- %----- %a
90 - 99-- 94.5--- 6-- 49-- 12.24-- 100.00
80 - 89-- 84.5--- 8-- 43-- 16.33-- 87.76
70 - 79-- 74.5-- 12-- 35-- 24.49-- 71.43
60 - 69-- 64.5-- 10-- 23-- 20.41-- 46.94
50 - 59-- 54.5--- 7-- 13-- 14.29-- 26.53
40 - 49-- 44.5--- 6--- 6-- 12.24-- 12.24
N=49











Calcula el Rango Percentil para una calificación de 92


¿? = 92
%aa = 87.6
Liv = 89.5
% = 12.24
i= 10


Sustitución de valores

RP92 = 87.76 + [92 – 89.5/10 (12.24)]
RP 92= 87.76 + 3.06
RP92 = 90.56 %

Interpretación1: Una persona cuya calificación fue de 92, supera al 90.56% del grupo en su calificación de matemáticas
Interpretación2: el 90.56 % de las calificaciones es menor que un 92, sólo el 9.44% de las calificaciones es superior a 92.

Percentil
Un percentil es un número que señala un valor específico sobre las puntuaciones de un grupo de datos. Por ejemplo, el percentil 30 es la calificación (tomando en cuenta el ejemplo anterior) que separa al 30 por ciento con puntuación más baja del conjunto de calificaciones obtenidas.
Los percentiles son una manera particularmente útil de describir las puntuaciones de un grupo, debido a que pueden ayudar a demostrar cómo rindieron los alumnos, (en el caso de las calificaciones, se puede saber quiénes son los mejores, quiénes superan la media, quiénes están por debajo de la media y quiénes son los alumnos peores).
Algunos percentiles tienen nombres especiales. El percentil 50, que separa la mitad inferior de los examinados de la mitad superior, se llama “mediana.”. El percentil 25, que separa al cuarto inferior de los examinados del resto, se llama “primer cuartil.” De manera similar, el percentil 75 se llama “tercer cuartil.”. El percentil 10, se llama “Decil 1”, el percentil 20, se llama “Decil 2”, y así sucesivamente

Cálculo del Percentil
Para calcular un Percentil dado se utiliza la siguiente fórmula:
P¿?=liv+[(¿?-%aa)/%(i)]

¿? = Percentil que se calculará
%aa = Porcentaje acumulado anterior a la clase donde se localiza el valor ¿?
Liv = Límite Inferior Verdadero
% = porcentaje de la clase donde se localiza el ¿?
i= Tamaño del intervalo

Ejemplo: Calificaciones del curso de matemáticas
Clases---- X---- f----- fa--- %----- %a
90 - 99-- 94.5--- 6--- 49-- 12.24-- 100.00
80 - 89-- 84.5--- 8--- 43-- 16.33-- 87.76
70 - 79-- 74.5-- 12-- 35-- 24.49-- 71.43
60 - 69-- 64.5-- 10-- 23-- 20.41-- 46.94
50 - 59-- 54.5--- 7--- 13-- 14.29-- 26.53
40 - 49-- 44.5--- 6---- 6--- 12.24-- 12.24
-------------N=49











Calcula el Percentil 40

¿? = 40
%aa = 26.53
Liv = 59.5
% = 20.41
i= 10



Sustitución de valores

P40 = 59.5 + [40 – 26.53/20.41 (10)]
P40 = 59.5 + 6.60
P40 = 66.10

Interpretación1: El 40 % de los alumnos obtuvo una calificación de 66.10 o menos
Interpretación2: Una calificación de 66.10 o menor la obtuvo el 40% de los alumnos.

Nota: El concepto de un percentil está estrechamente relacionado con el de un rango percentil. Por ejemplo, el percentil 50 de un grupo es la puntuación que tiene un rango percentil 50 en ese grupo, el percentil 68 es la puntuación que tiene un rango de percentil 68; y así sucesivamente.

Datos numéricos. Organización de los datos

¿Cómo organizo los datos?
Si los datos son numéricos (discretos o continuos) es posible organizarlos de tres formas:
Lista de datos
Distribución de “f” simple
Distribución de “f” agrupada

a) Lista de datos. Para construir una lista de datos basta con ordenar los datos del mayor al menor o viceversa, por ejemplo supón que solicitamos la estatura en centímetros a 10 alumnos y éstos dan como datos: 168, 160, 185, 175, 178, 190, 172, 170, 170 y 163. Al construir una lista de datos queda:

X (“X” se refiere a “X” característica o a “X” variable)
190
185
178
175
172
170
170
168
163
160

N=10 datos

Nota: Es de hacer notar que una lista de datos se utiliza cuando tenemos pocos datos (de preferencia menos de 15), ya que hacerla con más dificultaría su lectura

b) Distribución de “f” simple. Para construir una distribución de “f” simple se forman dos columnas, una con valores de la variable y otra de “f” o veces que aparece cada valor. Se usa cuando los datos son muy repetitivos. Por ejemplo si se solicita a un grupo de cuarenta alumnos sus calificaciones en estadística, al construir una distribución de “f” simple, ésta queda así:
X--- f
10-- 4
9--- 6
8-- 10
7-- 12
6--- 5
5--- 3
------N=40

Nota: Observa como mejora la organización de los datos si éstos originalmente fueron dados de la siguiente manera: 8, 7, 9, 5, 10, 8, 8, 7, 6, 5, 8, 7, 8, 6, 8, 8, 6, 9, 7, 6, 10, 6, 7, 5, 7, 9, 7, 10, 9, 8, 7, 7, 9, 8, 7, 9, 8, 7, 7, 10

c) Distribución de “f” agrupada. Para construir una distribución de “f” agrupada, es necesario desarrollar una serie de pasos:

Convencionalismo a utilizar para determinar el número de intervalos o clases y comenzar a construirlos
Nota: Observa los datos y determina la unidad de medición de ellos (unidades, décimos, centésimos, etc.)

1. Calcula el rango Rango de datos (R= valor máximo menos valor mínimo).
2. Determina el número aproximado de intervalos o clases a utilizar con la siguiente fórmula (Nº de clases=√("número de datos" )).
3. Calcula el ancho de clase o intervalo (i) por medio de la siguiente fórmula i=(R+1u)/Numero de clases.
Nota1: La unidad de medición está en función de las cifras significativas que se manejan en los datos.
Nota2: Para facilitar el trabajo posterior se recomienda, redondear al impar más cercano.
Nota3: En caso de que obtengas un N° par, puedes redondear al entero impar siguiente o anterior.
4. Para construir la primera clase toma el valor máximo, réstale el valor de “i” y suma una unidad de medición. La primera clase estará conformada por el valor que obtuviste y el valor máximo.
5. Para construir las clases siguientes resta “i” a cada valor de la primer clase. Nota: la última clase deberá contener el valor mínimo de tus datos.
6. Calcula el punto medio de cada clase o intervalo sumando el valor mínimo y máximo de cada clase y dividiendo el resultado entre dos.
7. Determina la frecuencia de datos en cada clase o intervalo

Tipos de datos y variables

Tipos de variables

Una variable expresa la medición de alguna característica. Un ejemplo de variable es la que asigna a cada individuo de una comunidad el número de tortillas que ingirió el 30 de junio.
Las variables permiten clasificar a los individuos, objetos, entidades, etc. en los que se mide la característica. En el ejemplo anterior, los individuos pueden quedar clasificados en aquéllos que no ingirieron tortillas, los que ingirieron una tortilla, los que ingirieron dos, etc.
Las variables son la herramienta fundamental de la estadística; por ello se hace necesario considerar con algún detalle qué tipo de valores pueden tomar las variables, puesto que las técnicas estadísticas que se apliquen dependerán de ellos; es claro, por ejemplo, que no se podrá calcular el promedio de una serie de valores “Masculino" y "Femenino" como los que surgirían de la variable sexo de los alumnos de un grupo.
En este tema veremos una forma de clasificar las variables de acuerdo al tipo de valores que puedan tomar. Para llegar a esa clasificación, analicemos las variables de los siguientes ejemplos:

Ejemplo 1.1
En una escuela secundaria, las labores que comienzan a las ocho de la mañana y el trabajo en equipo que en ellas se realiza se ve seriamente afectado por la impuntualidad de algunos estudiantes. Con el afán de detectar a qué se debe esta impuntualidad, un profesor y sus estudiantes se han propuesto averiguar si la forma de traslado de los alumnos a la escuela propicia esta situación. Para empezar su investigación preguntan a cada integrante de un grupo si usualmente se traslada de su casa a la escuela caminando o utilizando algún vehículo. En una lista del grupo anotan después de cada nombre c ó v según si el alumno correspondiente se traslada caminando o si utiliza algún vehículo.
De este modo se tiene una variable que podríamos llamar forma de traslado cuyos valores son "caminando" (c) y "en algún vehículo" (v) y que clasifica a los alumnos del grupo en dos categorías.

Ejemplo 1.2
Con el fin de conocer más a sus alumnos al inicio del año escolar, una maestra les pide que señalen la materia de su preferencia en una lista en la que aparecen. Ciencias Sociales, Matemáticas, Ciencias Naturales y Español.
En este caso la variable materia de preferencia puede tomar cuatro valores: "Matemáticas", "Ciencias Naturales", "Ciencias Sociales" y "Español"; la maestra puede registrar la preferencia de cada alumno con las iniciales de cada materia: M, CN, CS y E. Es claro que la variable materia de preferencia clasifica a los alumnos en cuatro categorías.
Observe que los valores que pueden tomar las variables de los ejemplos 1.1 y 1.2 son expresiones. En el ejemplo 1.1 estas expresiones fueron: "caminando" (c) y "en algún vehículo" (v), y en el ejemplo 1.2 los valores de la variable fueron: "Ciencias Sociales" (CS), "Ciencias Naturales" (CN), "Matemáticas" (M) y "Español" (E). Observe también que estas expresiones han sido sustituidas por los símbolos: c, v; CS, CN, M, E; estos símbolos se podrían haber sustituido por otros como ( y x ) ó (0 y 1) en el primer caso y como (,,,) ó (1, 2, 3, 4) en el segundo. En cada caso, los símbolos utilizados son solamente etiquetas que nos permiten diferenciar la categoría a la que pertenece cada individuo, la cual está determinada por el valor de la variable.

Veamos ahora ejemplos de otro tipo de variables:

Ejemplo 1.3
En un Cuaderno de Actividades a Distancia que se usó en el curso de Matemáticas I aparece una encuesta de opinión sobre las unidades del curso, en la que se incluye la pregunta y opciones de respuesta que presentamos en la siguiente figura:


14. ¿Los ejemplos estuvieron relacionados con el contenido de cada una de las unidades?

a) Nunca
b) Raras veces
c) Algunas veces
d) Casi siempre
e) Siempre

Fig. 1.1

Si consideramos por ejemplo la unidad de los números reales, esta pregunta permite medir la opinión de cada alumno sobre la relación de los ejemplos con el contenido de esta unidad. Los valores que puede tomar la variable opinión sobre la relación ejemplo-contenido son: "Nunca" (A), "Raras veces" (B), "Algunas veces" (C), "Casi siempre" (D) y "Siempre" (E). Observe que esta variable clasifica a los estudiantes que contestaron la pregunta según la opción que hayan elegido.

Ejemplo 1.4
Sabemos que el aprovechamiento escolar de un niño depende, en gran parte, de la alimentación que éste recibe. A un maestro le interesa conocer cómo se alimentan los niños de la comunidad rural en la que trabaja. Con este fin, pregunta diariamente a cada uno de sus alumnos cuáles alimentos ingirió durante el día anterior.
Cada mes, el maestro asigna, de acuerdo a tablas de consumo ideal*, MD al alumno que se alimentó muy deficientemente, D al niño cuya alimentación fue deficiente, R al que tuvo una alimentación regular, B al alumno que recibió alimentación buena y MB al que se alimentó muy bien. Los valores posibles de la variable calidad de la alimentación pueden ser: MD, D, R, B y MB; con esto los niños quedarían distribuidos en cinco posibles categorías.
Observe que los valores que pueden tomar las variables de los ejemplos 1.3 y 1.4 son expresiones como en los dos primeros ejemplos; sin embargo, entre los valores de estas dos últimas variables hay un orden. Esto nos permite saber, por ejemplo, que un niño cuya alimentación se calificó de regular (R) está mejor alimentado que uno cuya alimentación se calificó como deficiente (D); sin embargo, es importante hacer notar que con sólo los valores R y D no sabemos cuánto mejor es la alimentación del primero que la del segundo.

Veamos ahora algunos ejemplos de otro tipo de variables:

Ejemplo 1.5
A una trabajadora social le interesa conocer el número de hijos de las familias de una comunidad, para llevar a cabo un estudio socioeconómico de éstas.
Al registrar la información deseada, la trabajadora social le asocia a cada familia el número que corresponde a los hijos que ésta tiene. Es claro que los posibles valores de la variable número de hijos son el cero y los primeros números enteros positivos. En esta forma, la trabajadora social puede clasificar a las familias de acuerdo al número de hijos que tiene cada una.

Ejemplo 1.6
Un maestro de matemáticas aplica un examen diagnóstico a su grupo de primer año de secundaria antes de iniciar el estudio de una unidad del programa. Como le interesa medir los antecedentes que tiene cada alumno sobre el tema, su examen contiene preguntas sobre lo que incluyen los libros de primaria al respecto. El instrumento que aplica consta de doce reactivos de opción múltiple, por lo que el alumno responde correcta o incorrectamente cada pregunta sin que haya posibilidades intermedias. El profesor anota el número de reactivos contestados correctamente por cada estudiante y ésta será la forma en que medirá los antecedentes que tiene cada alumno sobre el tema.
En este caso los valores que puede tomar la variable número de aciertos son el cero y los números enteros positivos del uno al doce; esto permitirá al profesor clasificar a sus alumnos en trece grupos distintos según el número de aciertos que hayan obtenido.

En estos últimos dos ejemplos los valores que toman las variables son números enteros no negativos; en estos casos tiene sentido, por ejemplo, efectuar operaciones aritméticas con ellos, compararlos o calcular la diferencia entre un valor y otro. Como en los casos anteriores, los valores de estas variables permiten clasificar en categorías a los individuos.

Veremos, por último, ejemplos de otro tipo de variables:

Ejemplo 1.7
Un profesor de educación física quiere saber cuánto crecen en un año los niños de 7 años de la comunidad en la que trabaja. Para ello, mide a sus alumnos de segundo año de primaria con la regla de una báscula y anota el resultado de la medición aproximándolo a milímetros, ya que ésta es la precisión con la que le interesa medir.
En este caso los valores posibles de la variable son todos los números pertenecientes a algún intervalo; la precisión de la medición depende del instrumento con el que se cuenta. Como en los casos anteriores, la variable estatura clasifica a los individuos.

Ejemplo 1.8
El director de una primaria mide la cantidad de agua consumida diariamente en la escuela. Para ello registra las lecturas del medidor de agua a la misma hora todos los días durante un mes, y resta a la lectura de cada día la del día anterior. Como en el ejemplo anterior, la precisión de la medición dependerá del instrumento con el que se cuente y los valores que puede tomar la variable cantidad de agua consumida diariamente son todos los números reales que pertenecen a cierto intervalo. Esta variable permite clasificar los días por su consumo de agua.
Observe que las variables de los últimos dos ejemplos toman valores en intervalos de números reales y que tiene sentido, por ejemplo, comparar estos valores y efectuar operaciones aritméticas con ellos.
Lo que nos permitirá clasificar las variables es el tipo de valores que pueden tomar. Al plantear los ejemplos anteriores hemos observado el tipo de valores que toman y las características de éstos.
Las variables como las de los ejemplos 1.1 a 1.4, cuyos valores son expresiones, se denominan categóricas. Cuando los valores de una variable categórica permiten únicamente ubicar a cada individuo en una categoría y no hay orden entre estos valores, como en los ejemplos 1.1 y 1.2, se dice que la variable es categórica nominal. Cuando los valores de una variable categórica tienen un orden, como en los ejemplos 1.3 y 1.4, se dice que la variable es categórica ordinal.
Las variables como las de los ejemplos 1.5 a 1.8, cuyos valores son números y en donde además tiene sentido efectuar operaciones aritméticas con ellos y compararlos, se llaman numéricas. Observe que los valores que pueden tomar las variables de los ejemplos 1.5 y 1.6 son números enteros: una variable de este tipo se llama numérica discreta. Cuando una variable puede tomar cualquier valor en algún intervalo de números reales, como en los ejemplos 1.7 y 1.8, se dice que la variable es numérica continua.
Es frecuente que se expresen los valores de variables categóricas mediante números. Sin embargo, en estos casos los números sólo son símbolos que sirven para diferenciar las distintas categorías y carecen por lo tanto de propiedades aritméticas. Así, en el ejemplo 1.4, el maestro pudo haber utilizado los símbolos 1, 2, 3, 4 y 5 para las categorías MD, D, R, B y MB respectivamente. Sin embargo, esto no habría significado, por ejemplo, que la diferencia en la calidad de la alimentación entre dos niños de las categorías 2 ("Deficiente") y 3 ("Regular") fuera la misma que la diferencia entre dos niños de las categorías 3 ("Regular") y 4 ("Buena"). Es natural entonces preguntarse si, al encontrar una variable cuyos valores estén expresados por números, ésta es una variable categórica o numérica. Para contestar esta pregunta hay que pensar si son iguales las diferencias entre dos pares de valores subsecuentes: como acabamos de ver en el caso de la calidad de la alimentación, en las variables categóricas no tiene sentido la igualdad de tales diferencias.