martes, 9 de agosto de 2011

Tipos de datos y variables

Tipos de variables

Una variable expresa la medición de alguna característica. Un ejemplo de variable es la que asigna a cada individuo de una comunidad el número de tortillas que ingirió el 30 de junio.
Las variables permiten clasificar a los individuos, objetos, entidades, etc. en los que se mide la característica. En el ejemplo anterior, los individuos pueden quedar clasificados en aquéllos que no ingirieron tortillas, los que ingirieron una tortilla, los que ingirieron dos, etc.
Las variables son la herramienta fundamental de la estadística; por ello se hace necesario considerar con algún detalle qué tipo de valores pueden tomar las variables, puesto que las técnicas estadísticas que se apliquen dependerán de ellos; es claro, por ejemplo, que no se podrá calcular el promedio de una serie de valores “Masculino" y "Femenino" como los que surgirían de la variable sexo de los alumnos de un grupo.
En este tema veremos una forma de clasificar las variables de acuerdo al tipo de valores que puedan tomar. Para llegar a esa clasificación, analicemos las variables de los siguientes ejemplos:

Ejemplo 1.1
En una escuela secundaria, las labores que comienzan a las ocho de la mañana y el trabajo en equipo que en ellas se realiza se ve seriamente afectado por la impuntualidad de algunos estudiantes. Con el afán de detectar a qué se debe esta impuntualidad, un profesor y sus estudiantes se han propuesto averiguar si la forma de traslado de los alumnos a la escuela propicia esta situación. Para empezar su investigación preguntan a cada integrante de un grupo si usualmente se traslada de su casa a la escuela caminando o utilizando algún vehículo. En una lista del grupo anotan después de cada nombre c ó v según si el alumno correspondiente se traslada caminando o si utiliza algún vehículo.
De este modo se tiene una variable que podríamos llamar forma de traslado cuyos valores son "caminando" (c) y "en algún vehículo" (v) y que clasifica a los alumnos del grupo en dos categorías.

Ejemplo 1.2
Con el fin de conocer más a sus alumnos al inicio del año escolar, una maestra les pide que señalen la materia de su preferencia en una lista en la que aparecen. Ciencias Sociales, Matemáticas, Ciencias Naturales y Español.
En este caso la variable materia de preferencia puede tomar cuatro valores: "Matemáticas", "Ciencias Naturales", "Ciencias Sociales" y "Español"; la maestra puede registrar la preferencia de cada alumno con las iniciales de cada materia: M, CN, CS y E. Es claro que la variable materia de preferencia clasifica a los alumnos en cuatro categorías.
Observe que los valores que pueden tomar las variables de los ejemplos 1.1 y 1.2 son expresiones. En el ejemplo 1.1 estas expresiones fueron: "caminando" (c) y "en algún vehículo" (v), y en el ejemplo 1.2 los valores de la variable fueron: "Ciencias Sociales" (CS), "Ciencias Naturales" (CN), "Matemáticas" (M) y "Español" (E). Observe también que estas expresiones han sido sustituidas por los símbolos: c, v; CS, CN, M, E; estos símbolos se podrían haber sustituido por otros como ( y x ) ó (0 y 1) en el primer caso y como (,,,) ó (1, 2, 3, 4) en el segundo. En cada caso, los símbolos utilizados son solamente etiquetas que nos permiten diferenciar la categoría a la que pertenece cada individuo, la cual está determinada por el valor de la variable.

Veamos ahora ejemplos de otro tipo de variables:

Ejemplo 1.3
En un Cuaderno de Actividades a Distancia que se usó en el curso de Matemáticas I aparece una encuesta de opinión sobre las unidades del curso, en la que se incluye la pregunta y opciones de respuesta que presentamos en la siguiente figura:


14. ¿Los ejemplos estuvieron relacionados con el contenido de cada una de las unidades?

a) Nunca
b) Raras veces
c) Algunas veces
d) Casi siempre
e) Siempre

Fig. 1.1

Si consideramos por ejemplo la unidad de los números reales, esta pregunta permite medir la opinión de cada alumno sobre la relación de los ejemplos con el contenido de esta unidad. Los valores que puede tomar la variable opinión sobre la relación ejemplo-contenido son: "Nunca" (A), "Raras veces" (B), "Algunas veces" (C), "Casi siempre" (D) y "Siempre" (E). Observe que esta variable clasifica a los estudiantes que contestaron la pregunta según la opción que hayan elegido.

Ejemplo 1.4
Sabemos que el aprovechamiento escolar de un niño depende, en gran parte, de la alimentación que éste recibe. A un maestro le interesa conocer cómo se alimentan los niños de la comunidad rural en la que trabaja. Con este fin, pregunta diariamente a cada uno de sus alumnos cuáles alimentos ingirió durante el día anterior.
Cada mes, el maestro asigna, de acuerdo a tablas de consumo ideal*, MD al alumno que se alimentó muy deficientemente, D al niño cuya alimentación fue deficiente, R al que tuvo una alimentación regular, B al alumno que recibió alimentación buena y MB al que se alimentó muy bien. Los valores posibles de la variable calidad de la alimentación pueden ser: MD, D, R, B y MB; con esto los niños quedarían distribuidos en cinco posibles categorías.
Observe que los valores que pueden tomar las variables de los ejemplos 1.3 y 1.4 son expresiones como en los dos primeros ejemplos; sin embargo, entre los valores de estas dos últimas variables hay un orden. Esto nos permite saber, por ejemplo, que un niño cuya alimentación se calificó de regular (R) está mejor alimentado que uno cuya alimentación se calificó como deficiente (D); sin embargo, es importante hacer notar que con sólo los valores R y D no sabemos cuánto mejor es la alimentación del primero que la del segundo.

Veamos ahora algunos ejemplos de otro tipo de variables:

Ejemplo 1.5
A una trabajadora social le interesa conocer el número de hijos de las familias de una comunidad, para llevar a cabo un estudio socioeconómico de éstas.
Al registrar la información deseada, la trabajadora social le asocia a cada familia el número que corresponde a los hijos que ésta tiene. Es claro que los posibles valores de la variable número de hijos son el cero y los primeros números enteros positivos. En esta forma, la trabajadora social puede clasificar a las familias de acuerdo al número de hijos que tiene cada una.

Ejemplo 1.6
Un maestro de matemáticas aplica un examen diagnóstico a su grupo de primer año de secundaria antes de iniciar el estudio de una unidad del programa. Como le interesa medir los antecedentes que tiene cada alumno sobre el tema, su examen contiene preguntas sobre lo que incluyen los libros de primaria al respecto. El instrumento que aplica consta de doce reactivos de opción múltiple, por lo que el alumno responde correcta o incorrectamente cada pregunta sin que haya posibilidades intermedias. El profesor anota el número de reactivos contestados correctamente por cada estudiante y ésta será la forma en que medirá los antecedentes que tiene cada alumno sobre el tema.
En este caso los valores que puede tomar la variable número de aciertos son el cero y los números enteros positivos del uno al doce; esto permitirá al profesor clasificar a sus alumnos en trece grupos distintos según el número de aciertos que hayan obtenido.

En estos últimos dos ejemplos los valores que toman las variables son números enteros no negativos; en estos casos tiene sentido, por ejemplo, efectuar operaciones aritméticas con ellos, compararlos o calcular la diferencia entre un valor y otro. Como en los casos anteriores, los valores de estas variables permiten clasificar en categorías a los individuos.

Veremos, por último, ejemplos de otro tipo de variables:

Ejemplo 1.7
Un profesor de educación física quiere saber cuánto crecen en un año los niños de 7 años de la comunidad en la que trabaja. Para ello, mide a sus alumnos de segundo año de primaria con la regla de una báscula y anota el resultado de la medición aproximándolo a milímetros, ya que ésta es la precisión con la que le interesa medir.
En este caso los valores posibles de la variable son todos los números pertenecientes a algún intervalo; la precisión de la medición depende del instrumento con el que se cuenta. Como en los casos anteriores, la variable estatura clasifica a los individuos.

Ejemplo 1.8
El director de una primaria mide la cantidad de agua consumida diariamente en la escuela. Para ello registra las lecturas del medidor de agua a la misma hora todos los días durante un mes, y resta a la lectura de cada día la del día anterior. Como en el ejemplo anterior, la precisión de la medición dependerá del instrumento con el que se cuente y los valores que puede tomar la variable cantidad de agua consumida diariamente son todos los números reales que pertenecen a cierto intervalo. Esta variable permite clasificar los días por su consumo de agua.
Observe que las variables de los últimos dos ejemplos toman valores en intervalos de números reales y que tiene sentido, por ejemplo, comparar estos valores y efectuar operaciones aritméticas con ellos.
Lo que nos permitirá clasificar las variables es el tipo de valores que pueden tomar. Al plantear los ejemplos anteriores hemos observado el tipo de valores que toman y las características de éstos.
Las variables como las de los ejemplos 1.1 a 1.4, cuyos valores son expresiones, se denominan categóricas. Cuando los valores de una variable categórica permiten únicamente ubicar a cada individuo en una categoría y no hay orden entre estos valores, como en los ejemplos 1.1 y 1.2, se dice que la variable es categórica nominal. Cuando los valores de una variable categórica tienen un orden, como en los ejemplos 1.3 y 1.4, se dice que la variable es categórica ordinal.
Las variables como las de los ejemplos 1.5 a 1.8, cuyos valores son números y en donde además tiene sentido efectuar operaciones aritméticas con ellos y compararlos, se llaman numéricas. Observe que los valores que pueden tomar las variables de los ejemplos 1.5 y 1.6 son números enteros: una variable de este tipo se llama numérica discreta. Cuando una variable puede tomar cualquier valor en algún intervalo de números reales, como en los ejemplos 1.7 y 1.8, se dice que la variable es numérica continua.
Es frecuente que se expresen los valores de variables categóricas mediante números. Sin embargo, en estos casos los números sólo son símbolos que sirven para diferenciar las distintas categorías y carecen por lo tanto de propiedades aritméticas. Así, en el ejemplo 1.4, el maestro pudo haber utilizado los símbolos 1, 2, 3, 4 y 5 para las categorías MD, D, R, B y MB respectivamente. Sin embargo, esto no habría significado, por ejemplo, que la diferencia en la calidad de la alimentación entre dos niños de las categorías 2 ("Deficiente") y 3 ("Regular") fuera la misma que la diferencia entre dos niños de las categorías 3 ("Regular") y 4 ("Buena"). Es natural entonces preguntarse si, al encontrar una variable cuyos valores estén expresados por números, ésta es una variable categórica o numérica. Para contestar esta pregunta hay que pensar si son iguales las diferencias entre dos pares de valores subsecuentes: como acabamos de ver en el caso de la calidad de la alimentación, en las variables categóricas no tiene sentido la igualdad de tales diferencias.

No hay comentarios:

Publicar un comentario