jueves, 30 de agosto de 2018
Ejercicio con sort e in (con solución en video)
Cárguese en memoria el archivo auto.dta, que viene con Stata.
Conteste las siguientes preguntas:
¿Cuáles son las 5 marcas y modelos (variable make) más económicas de la base?
De los autos que rinden entre 28 y 36 millas por galón (variable mpg), ¿cuáles son las tres marcas (variable make) más económicas?
El auto de mayor peso, ¿es nacional o extranjero (variable foreign)? ¿de qué marca es (variable make)?
Video
sábado, 25 de agosto de 2018
El calificador "in" (texto)
Se dice que "in" es un calificador. ¿Por qué?
Porque califica, especifica, las observaciones a que se aplicarán un conjunto de comandos.
En la ayuda de "in" se ponen los siguientes ejemplos.
sysuse auto
. list price in 10
Ese "in 10" significa que solo se tomará la observación Nro. 10.
. list price in 10/20
"in 10/20" significa que se listarán las observaciones que van del 10 al 20
. list price in 20/l
"in 20/l" indica que se tomarán las observaciones de 20 hasta la última (l por last: No es un 1).
"in 20/L" es una expresión sinónima de la anterior, esta vez con mayúscula.
. list price in -10/l (expresión sinónima de -10/L)
"in -10/l" significa las 10 últimas. De la menos 10 a la última (last). No confundir la letra l con un número 1.
Este calificador se aplica con frecuencia en combinación con sort.
Por ejemplo, si queremos los 8 precios más baratos, podemos ordenar la base y luego pedir los primeros ocho casos.
sort precio
list precio in 1/8
Y si quisiéramos los siete precios más caros los podríamos pedir así:
gsort - precio
list precio in 1/7
lunes, 20 de agosto de 2018
Comandos "sort" y "gsort". Video.
Los comandos sort y gsort sirven para ordenar la base según una o más variables.
sort
sort ordena la base de forma ascendente.
Ejemplo: si queremos ordenar una base de forma ascendente según la variable precio deberemos escribir el comando
sort precio
gsort
El comando gsort (por generalized sort) es más amplio: permite ordenar en forma ascendente o descendente.
Si quisiéramos ordenar por precios ascendentes, podemos escribir:
gsort price (o, lo que es equivalente, gsort + price)
Si quisiéramos ordenar por precios descendentes, podemos escribir:
gsort - price
Ordenando por dos o más variables
Tanto con gsort como con sort es posible ordenar por dos variables o más. ¿Qué quiere decir ordenar por dos variables? Ordenar por la primera variable, y si hay empates en la primera, ordenar los casos empatados en la primera por una segunda variable.
Por ejemplo, el comando
gsort color -precio
ordenaría primero por color, y dentro de cada color, si hay empates, en forma descendente por precio.
Pero, ¿para qué sirve ordenar la base?
En general las bases se ordenan cuando se desean conocer los valores menores o mayores de alguna variable.
Por ejemplo, si tenemos una base de libros puede interesarnos saber cuáles son los más vendidos, o los menos vendidos.
Si vamos a comprar un auto, puede ser interesante conocer cuáles tienen mejor kilometraje por litro de nafta, etc.
Video
sábado, 18 de agosto de 2018
Ejercicio sobre escuelas y alumnos, con comando egen y otros (sin solución)
En la base anexa hay datos sobre
escuelas y alumnos.
- ¿Qué variables se refieren a las clases?
- ¿Qué variables se refieren a los alumnos?
- ¿Hay relación entre la cantidad de alumnos que tienen las clases y las notas individuales que sacan los alumnos? ¿Parecen ser mejores iguales o peores las notas de los alumnos de clases más grandes?
- ¿Qué porcentaje de los alumnos excelentes (10 o más puntos) cursó con un equipamiento bueno?
miércoles, 15 de agosto de 2018
sábado, 11 de agosto de 2018
Problema de tipología de hogares (sin solución).Comando egen y otros
Se trabajará con una base extraida de la Encuesta Continua de Hogares 2019. Se pedirá la identificación de hogares con jefatura femenina y datos sobre dichos hogares y los niños que habitan en ellos.
Base de datos
Letra del problema
Base de datos
Letra del problema
viernes, 10 de agosto de 2018
Comando egen y prefijo bysort: tipología de hogares. Ejercicio con resolución en video
En esta entrada se plantea un problema a resolver usando fundamentalmente el prefijo bysort y el comando egen: se pide clasificar a los hogares de la Encuesta Continua de Hogares según una cierta tipología.
A continuación se hacen dos preguntas que se apoyan en dicha tipología.
Base de datos
Letra del problema
Do file
Video
martes, 7 de agosto de 2018
Ejercicio sobre nivel educativo del hogar, con comando egen y otros (sin solución)
La base adjunta simula una base que fusiona datos de hogares y de personas.
Para las personas se recogió su rol en el hogar (padre, madre o hijo), la edad, los años de educación, y para los niños también el promedio de notas con que atraviesan su recorrido educacional.
Se pregunta:
Calcule tres formas de nivel educativo.
a) Se calculará el NivelEducativo1 que consistirá de la máxima cantidad de años alcanzados ya sea por la madre o por el padre. O sea, si, pe. el padre tuviese 12 y la madre 14, NivelEducativo1 tomará el valor 14.
b) Se calculará el NivelEducativo2, que consistirá del promedio de años de educación alcanzados por el padre y por la madre. Ej: si el padre tuviese 8 y la madre 10, Nivel Educativo2 tomará el valor 9.
c) Se calculará el NivelEducativo3, que consistirá de los años de educación alcanzados por la madre.
d) Se estudiará cuál presenta una correlación mayor con las notas de los hijos. Para esto se utilizará la rho de Spearman.
e) Se elegirá la variable que presente mayor correlación con las notas. Esta variable será dicotomizada en nivel educativo el hogar alto y nivel educativo bajo. Queda a criterio del estudiante el punto de corte para dicotomizar.
f) Se hará una tabla que vincule el nivel educativo con las notas medias de los hijos.
Base de datos
Para las personas se recogió su rol en el hogar (padre, madre o hijo), la edad, los años de educación, y para los niños también el promedio de notas con que atraviesan su recorrido educacional.
Se pregunta:
Calcule tres formas de nivel educativo.
a) Se calculará el NivelEducativo1 que consistirá de la máxima cantidad de años alcanzados ya sea por la madre o por el padre. O sea, si, pe. el padre tuviese 12 y la madre 14, NivelEducativo1 tomará el valor 14.
b) Se calculará el NivelEducativo2, que consistirá del promedio de años de educación alcanzados por el padre y por la madre. Ej: si el padre tuviese 8 y la madre 10, Nivel Educativo2 tomará el valor 9.
c) Se calculará el NivelEducativo3, que consistirá de los años de educación alcanzados por la madre.
d) Se estudiará cuál presenta una correlación mayor con las notas de los hijos. Para esto se utilizará la rho de Spearman.
e) Se elegirá la variable que presente mayor correlación con las notas. Esta variable será dicotomizada en nivel educativo el hogar alto y nivel educativo bajo. Queda a criterio del estudiante el punto de corte para dicotomizar.
f) Se hará una tabla que vincule el nivel educativo con las notas medias de los hijos.
Base de datos
lunes, 6 de agosto de 2018
Ejercicio con egen y bysort, resuelto en Video
En el archivo do file se plantean algunas preguntas, encabezadas por asteriscos, lo que las transforma en comentarios.
Se refieren a la base de datos, que simula equipos que compiten en aeronáutica, y que están compuestos por pilotos, entrenadores y psicólogos.
Do file
Base de datos
Video
domingo, 5 de agosto de 2018
Ejemplo de uso de egen y bysort. Video
El archivo dta contiene información ficticia sobre personas que viven en 5 hogares distintos.
Con la información de las personas se crearán variables que caracterizarán a cada uno de los hogares: número de integrantes, salarios totales del hogar, etc. Estas variables requerirán el uso del comando egen, con varias de sus funciones, y del prefijo sortby.
Archivo dta
Archivo do
Video
Suscribirse a:
Entradas (Atom)