jueves, 30 de agosto de 2018

Ejercicio con sort e in (con solución en video)


Cárguese en memoria el archivo auto.dta, que viene con Stata.

Conteste las siguientes preguntas:

¿Cuáles son las 5 marcas y modelos (variable make) más económicas de la base?

De los autos que rinden entre 28 y 36 millas por galón (variable mpg), ¿cuáles son las tres marcas (variable make) más económicas?

El auto de mayor peso, ¿es nacional o extranjero (variable foreign)? ¿de qué marca es (variable make)?


Video

sábado, 25 de agosto de 2018

Ejercicio con comando egen, sobre familias y alturas. Sin solución.


Base de datos

Letra del problema

El calificador "in" (texto)


Se dice que "in" es un calificador. ¿Por qué?

Porque califica, especifica, las observaciones a que se aplicarán un conjunto de comandos.

 En la ayuda de "in" se ponen los siguientes ejemplos.



 sysuse auto
        . list price in 10                                                                                                                   
 Ese "in 10" significa que solo se tomará la observación Nro. 10.

        . list price in 10/20












"in 10/20" significa que se listarán las observaciones que van del 10 al 20





        . list price in 20/l 
"in 20/l" indica que se tomarán las observaciones de 20 hasta la última (l por last: No es un 1).


"in 20/L" es una expresión sinónima de la anterior, esta vez con mayúscula.
                                                                                                                                      
        . list price in -10/l  (expresión sinónima de -10/L)
"in -10/l" significa las 10 últimas. De la menos 10 a la última (last). No confundir la letra l con un número 1.










Este calificador se aplica con frecuencia en combinación con sort.
Por ejemplo, si queremos los 8 precios más baratos, podemos ordenar la base y luego pedir los primeros ocho casos.


sort precio
list precio in 1/8


Y si quisiéramos los siete precios más caros los podríamos pedir así:
gsort - precio
list precio in 1/7

lunes, 20 de agosto de 2018

Comandos "sort" y "gsort". Video.


Los comandos sort y gsort sirven para ordenar la base según una o más variables.

sort

sort ordena la base de forma ascendente.

Ejemplo: si queremos ordenar una base de forma ascendente según la variable precio deberemos escribir el comando
sort precio



gsort

El comando gsort (por generalized sort) es más amplio: permite ordenar en forma ascendente o descendente.

Si quisiéramos ordenar por precios ascendentes, podemos escribir:

gsort price (o, lo que es equivalente, gsort + price)


Si quisiéramos ordenar por precios descendentes, podemos escribir:

gsort - price


Ordenando por dos o más variables


Tanto con gsort como con sort es posible ordenar por dos variables o más. ¿Qué quiere decir ordenar por dos variables? Ordenar por la primera variable, y si hay empates en la primera, ordenar los casos empatados en la primera por una segunda variable.

Por ejemplo, el comando

gsort color -precio

ordenaría primero por color, y dentro de cada color, si hay empates, en forma descendente por precio.



Pero, ¿para qué sirve ordenar la base?

En general las bases se ordenan cuando se desean conocer los valores menores o mayores de alguna variable.

Por ejemplo, si tenemos una base de libros puede interesarnos saber cuáles son los más vendidos, o los menos vendidos.

Si vamos a comprar un auto, puede ser interesante conocer cuáles tienen mejor kilometraje por litro de nafta, etc.






Video










sábado, 18 de agosto de 2018

Ejercicio sobre escuelas y alumnos, con comando egen y otros (sin solución)




En la base anexa hay datos sobre escuelas y alumnos.


  1. ¿Qué variables se refieren a las clases?
  2. ¿Qué variables se refieren a los alumnos?
  3. ¿Hay relación entre la cantidad de alumnos que tienen las clases y las notas individuales que sacan los alumnos? ¿Parecen ser mejores iguales o peores las notas de los alumnos de clases más grandes?
  4. ¿Qué porcentaje de los alumnos excelentes (10 o más puntos) cursó con un equipamiento bueno?


Base de datos

sábado, 11 de agosto de 2018

Problema de tipología de hogares (sin solución).Comando egen y otros

Se trabajará con una base extraida de la Encuesta Continua de Hogares 2019. Se pedirá la identificación de hogares con jefatura femenina y datos sobre dichos hogares y los niños que habitan en ellos.



Base de datos

Letra del problema

viernes, 10 de agosto de 2018

Comando egen y prefijo bysort: tipología de hogares. Ejercicio con resolución en video


En esta entrada se plantea un problema a resolver usando fundamentalmente el prefijo bysort y el comando egen: se pide clasificar a los hogares de la Encuesta Continua de Hogares según una cierta tipología.

A continuación se hacen dos preguntas que se apoyan en dicha tipología.




Base de datos

Letra del problema

Do file

Video

martes, 7 de agosto de 2018

Ejercicio sobre nivel educativo del hogar, con comando egen y otros (sin solución)

La base adjunta simula una base que fusiona datos de hogares y de personas.

Para las personas se recogió su rol en el hogar (padre, madre o hijo), la edad, los años de educación, y para los niños también el promedio de notas con que atraviesan su recorrido educacional.

Se pregunta:

Calcule tres formas de nivel educativo.

a) Se calculará el NivelEducativo1 que consistirá de la máxima cantidad de años alcanzados ya sea por la madre o por el padre. O sea, si, pe. el padre tuviese 12 y la madre 14, NivelEducativo1 tomará el valor 14.

b) Se calculará el NivelEducativo2, que consistirá del promedio de años de educación alcanzados por el padre y por la madre. Ej: si el padre tuviese 8 y la madre 10, Nivel Educativo2 tomará el valor 9.

c) Se calculará el NivelEducativo3, que consistirá de los años de educación alcanzados por la madre.

d) Se estudiará cuál presenta una correlación mayor con las notas de los hijos. Para esto se utilizará la rho de Spearman.

e) Se elegirá la variable que presente mayor correlación con las notas. Esta variable será dicotomizada en nivel educativo el hogar alto y nivel educativo bajo. Queda a criterio del estudiante el punto de corte para dicotomizar.

f) Se hará una tabla que vincule el nivel educativo con las notas medias de los hijos.


Base de datos

lunes, 6 de agosto de 2018

Ejercicio con egen y bysort, resuelto en Video


En el archivo do file se plantean algunas preguntas, encabezadas por asteriscos, lo que las transforma en comentarios.

Se refieren a la base de datos, que simula equipos que compiten en aeronáutica, y que están compuestos por pilotos, entrenadores y psicólogos.



Do file

Base de datos

Video


domingo, 5 de agosto de 2018

Ejemplo de uso de egen y bysort. Video


El archivo dta contiene información ficticia sobre personas que viven en 5 hogares distintos.

Con la información de las personas se crearán variables que caracterizarán a cada uno de los hogares: número de integrantes, salarios totales del hogar, etc. Estas variables requerirán el uso del comando egen, con varias de sus funciones, y del prefijo sortby.



Archivo dta

Archivo do


Video