Skip to content

Commit

Permalink
further improvement of select and latin1 strings
Browse files Browse the repository at this point in the history
  • Loading branch information
caropradier committed Sep 11, 2023
1 parent 88ab6ae commit 41ff4f1
Show file tree
Hide file tree
Showing 18 changed files with 80 additions and 79 deletions.
3 changes: 2 additions & 1 deletion DESCRIPTION
Original file line number Diff line number Diff line change
Expand Up @@ -35,7 +35,8 @@ Imports:
stats,
cli,
httr,
curl
curl,
tidyselect
Depends: R (>= 2.10)
License: MIT + file LICENSE
Encoding: UTF-8
Expand Down
18 changes: 9 additions & 9 deletions R/calculate_errors.R
Original file line number Diff line number Diff line change
@@ -1,18 +1,18 @@
#' Calculo del desvío estándar y el coeficiente de variación
#' Calculo del desvio estandar y el coeficiente de variacion
#' @description
#' Asigna a una estimación de un total poblacional el desvío estándar o el coeficiente de variación
#' correspondiente según las tablas de error muestral de INDEC para EPH continua
#' Asigna a una estimacion de un total poblacional el desvio estandar o el coeficiente de variacion
#' correspondiente segun las tablas de error muestral de INDEC para EPH continua
#' a partir del segundo trimestre 2003.
#' (Ver `errores_muestrales`)
#' @param value Vector numérico de las estimaciones de población para las
#' que se desea hallar el desvío estándar o el coeficiente de variación.
#' @param codigo_aglo default = "Total". String con el código numerico del aglomerado al que
#' @param value Vector numerico de las estimaciones de poblacion para las
#' que se desea hallar el desvio estandar o el coeficiente de variacion.
#' @param codigo_aglo default = "Total". String con el codigo numerico del aglomerado al que
#' pertenecen las estimaciones. "Total" para trabajar estimaciones del conjunto de 31 aglomerados urbanos.
#' @param periodo_eph default = "2014.03". String indicando el periodo al que corresponde la EPH. "2014.03" para
#' obtener los errores muestrales correspondientes al tercer trimestre de 2014 en adelante. "2003.03_2014.02"
#' para los errores muestrales del tercer trimestre del 2003 al segundo trimestre del 2014.
#' @param measure default = "cv". String indicando la medida que se desea obtener. "cv" para obtener el coeficiente de variación
#' correspondiente a las estimaciones o "ds" para obtener el desvío estándar.
#' @param measure default = "cv". String indicando la medida que se desea obtener. "cv" para obtener el coeficiente de variacion
#' correspondiente a las estimaciones o "ds" para obtener el desvio estandar.
#'
#' @return Devuelve la estimacion de un total poblacional agregando el desvio estandar o el coeficiente de variacion correspondiente segun las tablas de error muestral de INDEC para EPH continua a partir del segundo trimestre 2003
#'
Expand Down Expand Up @@ -69,7 +69,7 @@ calculate_errors <- function(value, codigo_aglo = "Total", periodo_eph = "2014.0
# Operacion
tabla_referencia <- eph::errores_muestrales %>%
dplyr::filter(codigo == codigo_aglo & periodo == periodo_eph) %>%
dplyr::select(all_of(c("x", measure)))
dplyr::select(tidyselect::all_of(c("x", measure)))

find_closest <- function(y) {
tabla_referencia[[measure]][which.min(abs(tabla_referencia[["x"]] - y))]
Expand Down
2 changes: 1 addition & 1 deletion R/calculate_poverty.R
Original file line number Diff line number Diff line change
Expand Up @@ -51,7 +51,7 @@ calculate_poverty <- function(base, basket, print_summary = TRUE, window = "quar
TRUE ~ situacion
)
) %>%
dplyr::select(-any_of(c("adequi", "periodo", "CBA", "CBT")))
dplyr::select(-tidyselect::any_of(c("adequi", "periodo", "CBA", "CBT")))

if (print_summary) {
if (window == "quarter") {
Expand Down
4 changes: 2 additions & 2 deletions R/calculate_tabulates.R
Original file line number Diff line number Diff line change
Expand Up @@ -244,7 +244,7 @@ calculate_tabulates <- function(base,
dplyr::mutate(aux = sum(valor, na.rm = TRUE)) %>%
dplyr::ungroup() %>%
dplyr::mutate(prop = round((valor / aux) * 100, digits)) %>%
dplyr::select(-any_of(c("valor", "aux"))) %>%
dplyr::select(-tidyselect::any_of(c("valor", "aux"))) %>%
tidyr::pivot_wider(names_from = var, values_from = prop)

if (add.totals == "col") {
Expand Down Expand Up @@ -299,7 +299,7 @@ calculate_tabulates <- function(base,
perc_row <- tabulado %>%
dplyr::mutate(aux = rowSums(dplyr::across(dplyr::where(is.numeric)))) %>%
dplyr::mutate(dplyr::across(c(names(tabulado)[2:ncol(tabulado)]), function(x) round((x / aux) * 100, digits))) %>%
dplyr::select(-any_of(c("aux")))
dplyr::select(-tidyselect::any_of(c("aux")))


if (add.totals == "col") {
Expand Down
2 changes: 1 addition & 1 deletion R/canastas_reg_example.R
Original file line number Diff line number Diff line change
Expand Up @@ -6,7 +6,7 @@
#'
#' \describe{
#' \item{region}{Nombre de region}
#' \item{periodo}{Año.trimestre}
#' \item{periodo}{Anio.trimestre}
#' \item{CBA}{canasta basica alimentaria}
#' \item{CBT}{inversa del coeficiente de engels}
#' \item{codigo}{codigo de region}
Expand Down
2 changes: 1 addition & 1 deletion R/diccionario_aglomerados.R
Original file line number Diff line number Diff line change
@@ -1,4 +1,4 @@
#' Diccionario de aglomerados segun diseño de registro de la EPH
#' Diccionario de aglomerados segun diseno de registro de la EPH
#'
#' @format Un data frame con 32 filas y 2 variables
#'
Expand Down
4 changes: 2 additions & 2 deletions R/diccionario_regiones.R
Original file line number Diff line number Diff line change
@@ -1,10 +1,10 @@
#' Diccionario de regiones segun diseño de registro de la EPH
#' Diccionario de regiones segun diseno de registro de la EPH
#'
#' @format Un data frame con 6 filas y 2 variables
#'
#' \describe{
#' \item{codigo}{Codigo de region}
#' \item{region}{Nombre de región}
#' \item{region}{Nombre de region}
#'
#' }
"diccionario_regiones"
16 changes: 8 additions & 8 deletions R/errores_muestrales.R
Original file line number Diff line number Diff line change
@@ -1,18 +1,18 @@
#' @title Tabla con los errores muestrales para estimaciones de población
#' @description Base con los errores muestrales para estimaciones de población en los aglomerados urbanos
#' para la EPH continua desde 2003 segundo trimestre según documentación de INDEC:
#' @title Tabla con los errores muestrales para estimaciones de poblacion
#' @description Base con los errores muestrales para estimaciones de poblacion en los aglomerados urbanos
#' para la EPH continua desde 2003 segundo trimestre segun documentacion de INDEC:
#' https://www.indec.gob.ar/ftp/cuadros/menusuperior/eph/EPH_errores_muestreo_3t2014.pdf
#' https://www.indec.gob.ar/ftp/cuadros/menusuperior/eph/EPH_errores_muestreo.pdf
#' @format Un data frame con 1687 filas y 5 variables:
#' \describe{
#' \item{\code{codigo}}{character ---String con código numérico de los 31 aglomerados, "Gran Buenos Aires"
#' (sólo para 2003.03 a 2014.02), o con "Total" para el conjunto de los 31 aglomerados---}
#' \item{\code{codigo}}{character ---String con codigo numerico de los 31 aglomerados, "Gran Buenos Aires"
#' (solo para 2003.03 a 2014.02), o con "Total" para el conjunto de los 31 aglomerados---}
#' \item{\code{aglomerado}}{character ---String con el nombre del aglomerado---}
#' \item{\code{periodo}}{character ---String indicando el periodo de EPH que corresponde, "2014.03"
#' para datos de EPH a partir del tercer trimestre 2014, o "2003.03_2014.02" para datos anteriores---}
#' \item{\code{x}}{double ---Estimación de población para la cual se desea conocer el error muestral---}
#' \item{\code{ds}}{double ---Desvío Estándar correspondiente a la estimación de población en el aglomerado---}
#' \item{\code{cv}}{double ---Coeficiente de Variación correspondiente a la estimación de población en el aglomerado---}
#' \item{\code{x}}{double ---Estimacion de poblacion para la cual se desea conocer el error muestral---}
#' \item{\code{ds}}{double ---Desvio Estandar correspondiente a la estimacion de poblacion en el aglomerado---}
#' \item{\code{cv}}{double ---Coeficiente de Variacion correspondiente a la estimacion de poblacion en el aglomerado---}
#' }

"errores_muestrales"
6 changes: 3 additions & 3 deletions R/get_eahu.R
Original file line number Diff line number Diff line change
Expand Up @@ -77,7 +77,7 @@ get_eahu <- function(year = 2010,
dplyr::mutate(filter_col = purrr::map_lgl(error, ~ !is.null(.x))) %>%
dplyr::filter(filter_col) %>%
dplyr::mutate(error_message = purrr::map(error, ~ purrr::pluck(.x, 1))) %>%
dplyr::select(-any_of(c("microdata", "error"))) %>%
dplyr::select(-tidyselect::any_of(c("microdata", "error"))) %>%
tidyr::unnest(cols = c(error_message))

if (nrow(errors) > 0) {
Expand All @@ -88,7 +88,7 @@ get_eahu <- function(year = 2010,
}

df <- df %>%
dplyr::select(-any_of(c("error")))
dplyr::select(-tidyselect::any_of(c("error")))

if (!is.null(destfile) & !destfile_exists) {
saveRDS(df, file = destfile)
Expand All @@ -100,6 +100,6 @@ get_eahu <- function(year = 2010,
} else {
df %>%
tidyr::unnest(microdata) %>%
dplyr::select(-any_of(c("year", "type")))
dplyr::select(-tidyselect::any_of(c("year", "type")))
}
}
2 changes: 1 addition & 1 deletion R/get_eahu_internal.R
Original file line number Diff line number Diff line change
Expand Up @@ -61,7 +61,7 @@ get_eahu_internal <- function(year = 2010,

base <- base %>%
dplyr::rename_all(toupper) %>%
dplyr::select(all_of(vars))
dplyr::select(tidyselect::all_of(vars))

return(base)
}
Expand Down
6 changes: 3 additions & 3 deletions R/get_microdata.R
Original file line number Diff line number Diff line change
Expand Up @@ -98,7 +98,7 @@ get_microdata <- function(year = 2018,
dplyr::mutate(filter_col = purrr::map_lgl(error, ~ !is.null(.x))) %>%
dplyr::filter(filter_col) %>%
dplyr::mutate(error_message = purrr::map(error, ~ purrr::pluck(.x, 1))) %>%
dplyr::select(-any_of(c("microdata", "error"))) %>%
dplyr::select(-tidyselect::any_of(c("microdata", "error"))) %>%
tidyr::unnest(cols = c(error_message))

if (nrow(errors) > 0) {
Expand All @@ -109,7 +109,7 @@ get_microdata <- function(year = 2018,
}

df <- df %>%
dplyr::select(-any_of(c("error")))
dplyr::select(-tidyselect::any_of(c("error")))

if (!is.null(destfile) & !destfile_exists) {
saveRDS(df, file = destfile)
Expand All @@ -121,6 +121,6 @@ get_microdata <- function(year = 2018,
} else {
df %>%
tidyr::unnest(microdata) %>%
dplyr::select(-any_of(c("year", "period", "type")))
dplyr::select(-tidyselect::any_of(c("year", "period", "type")))
}
}
2 changes: 1 addition & 1 deletion R/get_microdata_internal.R
Original file line number Diff line number Diff line change
Expand Up @@ -198,7 +198,7 @@ Mas informacon en: https://www.indec.gob.ar/ftp/cuadros/sociedad/anexo_informe_e

base %>%
dplyr::rename_all(toupper) %>%
dplyr::select(all_of(vars))
dplyr::select(tidyselect::all_of(vars))
} else {
base
}
Expand Down
6 changes: 3 additions & 3 deletions R/get_total_urbano.R
Original file line number Diff line number Diff line change
Expand Up @@ -77,7 +77,7 @@ get_total_urbano <- function(year = 2016,
dplyr::mutate(filter_col = purrr::map_lgl(error, ~ !is.null(.x))) %>%
dplyr::filter(filter_col) %>%
dplyr::mutate(error_message = purrr::map(error, ~ purrr::pluck(.x, 1))) %>%
dplyr::select(-any_of(c("microdata", "error"))) %>%
dplyr::select(-tidyselect::any_of(c("microdata", "error"))) %>%
tidyr::unnest(cols = c(error_message))

if (nrow(errors) > 0) {
Expand All @@ -88,7 +88,7 @@ get_total_urbano <- function(year = 2016,
}

df <- df %>%
dplyr::select(-any_of(c("error")))
dplyr::select(-tidyselect::any_of(c("error")))

if (!is.null(destfile) & !destfile_exists) {
saveRDS(df, file = destfile)
Expand All @@ -100,6 +100,6 @@ get_total_urbano <- function(year = 2016,
} else {
df %>%
tidyr::unnest(microdata) %>%
dplyr::select(-any_of(c("year", "type")))
dplyr::select(-tidyselect::any_of(c("year", "type")))
}
}
2 changes: 1 addition & 1 deletion R/get_total_urbano_internal.R
Original file line number Diff line number Diff line change
Expand Up @@ -81,7 +81,7 @@ get_total_urbano_internal <- function(year = 2016,

base <- base %>%
dplyr::rename_all(toupper) %>%
dplyr::select(all_of(vars))
dplyr::select(tidyselect::all_of(vars))

return(base)
}
Expand Down
2 changes: 1 addition & 1 deletion R/is_in_github.R
Original file line number Diff line number Diff line change
Expand Up @@ -28,7 +28,7 @@ is_in_github <- function(year = 2018,
{
req <- httr::GET("https://api.github.com/repos/holatam/data/git/trees/master?recursive=1")

filelist <- unlist(lapply(httr::content(req)$tree, "[", "path"), use.names = F)
filelist <- unlist(lapply(httr::content(req)$tree, "[", "path"), use.names = FALSE)

looking_for <- sprintf("eph/%s/base_%s_%sT%s.RDS", type, type, year, period)

Expand Down
4 changes: 2 additions & 2 deletions R/organize_cno.R
Original file line number Diff line number Diff line change
Expand Up @@ -7,7 +7,7 @@
#' @return Devuelve la base con 4 columnas nuevas (ver `CNO`)
#'
#' @details
#' Importante: Verificar que el clasificador CNO 2001 sea compatible con la base que estés utilizando.
#' Importante: Verificar que el clasificador CNO 2001 sea compatible con la base que estes utilizando.
#'
#' disclaimer: El script no es un producto oficial de INDEC.
#'
Expand Down Expand Up @@ -64,7 +64,7 @@ organize_cno <- function(base) {
dplyr::left_join(., calificacion,
by = c("DIGIT5" = "value")
) %>%
dplyr::select(-any_of(c("CLASIF_CNO", "DIGIT12", "DIGIT3", "DIGIT4", "DIGIT5")))
dplyr::select(-tidyselect::any_of(c("CLASIF_CNO", "DIGIT12", "DIGIT3", "DIGIT4", "DIGIT5")))



Expand Down
6 changes: 3 additions & 3 deletions R/organize_panels.R
Original file line number Diff line number Diff line change
@@ -1,7 +1,7 @@
#' Pool de Datos en Panel - Base Individudal EPH continua
#'
#' Permite armar un pool de datos en panel de la EPH continua a partir
#' de especificar una serie consecutiva de bases, variables y el largo de la ventana -window- de observación
#' de especificar una serie consecutiva de bases, variables y el largo de la ventana -window- de observacion
#'
#' @param bases Lista de bases de microdatos a utilizar para armar el pool de datos
#' @param variables Vector con nombres de las variables de interes
Expand Down Expand Up @@ -32,7 +32,7 @@ organize_panels <- function(bases, variables, window = "anual") {
}

bases_continua <- dplyr::bind_rows(bases) %>%
dplyr::select(all_of(c("CODUSU", "NRO_HOGAR", "COMPONENTE",
dplyr::select(tidyselect::all_of(c("CODUSU", "NRO_HOGAR", "COMPONENTE",
"ANO4", "TRIMESTRE", "CH04", "CH06", variables))) %>%
dplyr::filter(ESTADO != 0) %>%
dplyr::mutate(Periodo = zoo::as.yearqtr(paste0(ANO4, " Q", TRIMESTRE)))
Expand All @@ -43,7 +43,7 @@ organize_panels <- function(bases, variables, window = "anual") {
paste0(x, "_t1")
}

## En Base a la amplitud del panel que especificaré al correr en la funcion resto en la Base
## En Base a la amplitud del panel que especificare al correr en la funcion resto en la Base
## Replica el identificador de Trimestre construido, para hacer un join con la Base.

bases_continua_join <- bases_continua %>%
Expand Down
Loading

0 comments on commit 41ff4f1

Please sign in to comment.