Modelos Estadísticos 1

Obteniendo resultados estadísticos con R, parte II

Posted in Tutoriales, Uncategorized by hector on abril 22, 2009

Esta es la segunda parte de una breve introducción a los comandos del sistema estadístico R. El objetivo es obtener fácilmente resultados de estadísticas descriptivas, y simulaciones de probabilidades, entre otros.

Al empezar a aprender un nuevo sistema puede resultar muy útil tener una referencia breve a la mano (un chivo, en buen chapín). Existen varias de estas para R, pero creo que ésta es muy buena.


Manejo de Variables

Empecemos hablando un poco del manejo de variables en R. Para ingresar unos pocos datos podemos usar el comando c() (concatenar). A continuación definimos una variable pesos con los pesos en libras de una familia con 5 miembros.

> pesos = c(136, 117, 215, 170, 152)
> sum(pesos)
[1] 790
> length(pesos)
[1] 5
> promedio = sum(pesos) / length(pesos)
> promedio
[1] 158
> mean(pesos)
[1] 158

Encontramos la suma de los pesos con el comando sum, la cantidad de pesos ingresados con el comando length (longitud de la variable), y encontramos el peso promedio de la familia de dos maneras: con la secuencia de comandos sum(pesos) / length(pesos) y más fácilmente con el comando mean. R ya incluye muchos comandos para que no tengamos que reinventar la rueda (vean la “reference card” al inicio de este artículo).

Algo que vale la pena entender es el manejo de índices en R. Veamos:

> pesos
[1] 136 117 215 170 152
> pesos[1]
[1] 136
> pesos[5]
[1] 152
> pesos[1:3]
[1] 136 117 215
> pesos[pesos > 150]
[1] 215 170 152
> pesos[pesos  pesos > 150
[1] FALSE FALSE  TRUE  TRUE  TRUE
> pesos < 150
[1]  TRUE  TRUE FALSE FALSE FALSE

Regresemos ahora a los datos de la encuesta de estudiantes que tratamos en la parte I, podemos clasificar (o filtrar) los datos empleando índices:

> Zap.mujer = Zapatos[Sexo == 'mujer']
> Zap.hombre = Zapatos[Sexo == 'hombre']
> boxplot(Zapatos, Zap.mujer, Zap.hombre, names=c('Todos', 'Mujeres', 'Hombres'))

zapatos

Parece cumplirse el estereotipo de que los hombres tienen pocos pares de zapatos, mientras que las mujeres tienen muchos.

Una forma más inmediata de filtrar los datos es empleando la sintaxis y~x; que se lee: la variable y descrita por la variable x.

> boxplot(Zapatos ~ Sexo)
> boxplot(Estatura ~ Sexo)

zapatos2

estatura

En esta última gráfica se aprecia que las estaturas de los hombres son, en general, mayores a las estaturas de las mujeres.

Resulta claro ahora que hay diferencias marcadas entre las características y hábitos de los estudiantes según el sexo.

Planteemos ahora otro tipo de pregunta: ¿estarán las horas de sueño de los estudiantes relacionadas con la hora a la cual deciden acostarse usualmente? Podemos ver la relación entre las variables Acostarse y horas.de.sueno (recuerden que habíamos definido horas.de.sueno = Levantarse - Acostarse):

> horas.de.sueno = Levantarse - Acostarse
> plot(Acostarse, horas.de.sueno)

scatter

Esta gráfica indica que los estudiantes que se acuestan más tarde, duermen menos.


Preguntas

  1. En promedio, ¿qué tanto más altos son los hombres que las mujeres entre los estudiantes encuestados?
  2. Elabore diagramas de caja y bigotes paralelos (boxplot) para los costos de corte de pelo, clasificados por sexo. ¿Qué puede decir de la gráfica obtenida?
  3. Construya una gráfica de barras de las frecuencias de los distintos valores que toma la variable Numero. Recuerde que esta variable describe un número aleatorio entre 1 y 10 proporcionado por el estudiante. ¿Por qué cree que, al tratar de pensar en un número aleatorio, algunos números son evitados sistemáticamente mientras otros ocurren frecuentemente?
Tagged with: , ,

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: