further improvement of select and latin1 strings

ropensci · Sep 11, 2023 · 41ff4f1 · 41ff4f1
1 parent 88ab6ae
commit 41ff4f1
Show file tree

Hide file tree

Showing 18 changed files with 80 additions and 79 deletions.
diff --git a/DESCRIPTION b/DESCRIPTION
@@ -35,7 +35,8 @@ Imports:
     stats,
     cli,
     httr,
-    curl
+    curl,
+    tidyselect
 Depends: R (>= 2.10)
 License: MIT + file LICENSE
 Encoding: UTF-8

diff --git a/R/calculate_errors.R b/R/calculate_errors.R
@@ -1,18 +1,18 @@
-#' Calculo del desvío estándar y el coeficiente de variación
+#' Calculo del desvio estandar y el coeficiente de variacion
 #' @description
-#' Asigna a una estimación de un total poblacional el desvío estándar o el coeficiente de variación
-#' correspondiente según las tablas de error muestral de INDEC para EPH continua
+#' Asigna a una estimacion de un total poblacional el desvio estandar o el coeficiente de variacion
+#' correspondiente segun las tablas de error muestral de INDEC para EPH continua
 #'  a partir del segundo trimestre 2003.
 #' (Ver `errores_muestrales`)
-#' @param value Vector numérico de las estimaciones de población para las
-#' que se desea hallar el desvío estándar o el coeficiente de variación.
-#' @param codigo_aglo default = "Total". String con el código numerico del aglomerado al que
+#' @param value Vector numerico de las estimaciones de poblacion para las
+#' que se desea hallar el desvio estandar o el coeficiente de variacion.
+#' @param codigo_aglo default = "Total". String con el codigo numerico del aglomerado al que
 #' pertenecen las estimaciones. "Total" para trabajar estimaciones del conjunto de 31 aglomerados urbanos.
 #' @param periodo_eph default = "2014.03". String indicando el periodo al que corresponde la EPH. "2014.03" para
 #' obtener los errores muestrales correspondientes al tercer trimestre de 2014 en adelante. "2003.03_2014.02"
 #' para los errores muestrales del tercer trimestre del 2003 al segundo trimestre del 2014.
-#' @param measure default = "cv". String indicando la medida que se desea obtener. "cv" para obtener el coeficiente de variación
-#' correspondiente a las estimaciones o "ds" para obtener el desvío estándar.
+#' @param measure default = "cv". String indicando la medida que se desea obtener. "cv" para obtener el coeficiente de variacion
+#' correspondiente a las estimaciones o "ds" para obtener el desvio estandar.
 #'
 #' @return Devuelve la estimacion de un total poblacional agregando el desvio estandar o el coeficiente de variacion correspondiente segun las tablas de error muestral de INDEC para EPH continua a partir del segundo trimestre 2003
 #'
@@ -69,7 +69,7 @@ calculate_errors <- function(value, codigo_aglo = "Total", periodo_eph = "2014.0
   # Operacion
   tabla_referencia <- eph::errores_muestrales %>%
     dplyr::filter(codigo == codigo_aglo & periodo == periodo_eph) %>%
-    dplyr::select(all_of(c("x", measure)))
+    dplyr::select(tidyselect::all_of(c("x", measure)))
 
   find_closest <- function(y) {
     tabla_referencia[[measure]][which.min(abs(tabla_referencia[["x"]] - y))]

diff --git a/R/calculate_poverty.R b/R/calculate_poverty.R
@@ -51,7 +51,7 @@ calculate_poverty <- function(base, basket, print_summary = TRUE, window = "quar
         TRUE ~ situacion
       )
     ) %>%
-    dplyr::select(-any_of(c("adequi", "periodo", "CBA", "CBT")))
+    dplyr::select(-tidyselect::any_of(c("adequi", "periodo", "CBA", "CBT")))
 
   if (print_summary) {
     if (window == "quarter") {

diff --git a/R/calculate_tabulates.R b/R/calculate_tabulates.R
@@ -244,7 +244,7 @@ calculate_tabulates <- function(base,
       dplyr::mutate(aux = sum(valor, na.rm = TRUE)) %>%
       dplyr::ungroup() %>%
       dplyr::mutate(prop = round((valor / aux) * 100, digits)) %>%
-      dplyr::select(-any_of(c("valor", "aux"))) %>%
+      dplyr::select(-tidyselect::any_of(c("valor", "aux"))) %>%
       tidyr::pivot_wider(names_from = var, values_from = prop)
 
     if (add.totals == "col") {
@@ -299,7 +299,7 @@ calculate_tabulates <- function(base,
     perc_row <- tabulado %>%
       dplyr::mutate(aux = rowSums(dplyr::across(dplyr::where(is.numeric)))) %>%
       dplyr::mutate(dplyr::across(c(names(tabulado)[2:ncol(tabulado)]), function(x) round((x / aux) * 100, digits))) %>%
-      dplyr::select(-any_of(c("aux")))
+      dplyr::select(-tidyselect::any_of(c("aux")))
 
 
     if (add.totals == "col") {

diff --git a/R/canastas_reg_example.R b/R/canastas_reg_example.R
@@ -6,7 +6,7 @@
 #'
 #' \describe{
 #' \item{region}{Nombre de region}
-#' \item{periodo}{Año.trimestre}
+#' \item{periodo}{Anio.trimestre}
 #' \item{CBA}{canasta basica alimentaria}
 #' \item{CBT}{inversa del coeficiente de engels}
 #' \item{codigo}{codigo de region}

diff --git a/R/diccionario_aglomerados.R b/R/diccionario_aglomerados.R
@@ -1,4 +1,4 @@
-#' Diccionario de aglomerados segun diseño de registro de la EPH
+#' Diccionario de aglomerados segun diseno de registro de la EPH
 #'
 #' @format  Un data frame con 32 filas y 2 variables
 #'

diff --git a/R/diccionario_regiones.R b/R/diccionario_regiones.R
@@ -1,10 +1,10 @@
-#' Diccionario de regiones segun diseño de registro de la EPH
+#' Diccionario de regiones segun diseno de registro de la EPH
 #'
 #' @format  Un data frame con 6 filas y 2 variables
 #'
 #' \describe{
 #' \item{codigo}{Codigo de region}
-#' \item{region}{Nombre de región}
+#' \item{region}{Nombre de region}
 #'
 #' }
 "diccionario_regiones"
diff --git a/R/errores_muestrales.R b/R/errores_muestrales.R
@@ -1,18 +1,18 @@
-#' @title Tabla con los errores muestrales para estimaciones de población
-#' @description Base con los errores muestrales para estimaciones de población en los aglomerados urbanos
-#'  para la EPH continua desde 2003 segundo trimestre según documentación de INDEC:
+#' @title Tabla con los errores muestrales para estimaciones de poblacion
+#' @description Base con los errores muestrales para estimaciones de poblacion en los aglomerados urbanos
+#'  para la EPH continua desde 2003 segundo trimestre segun documentacion de INDEC:
 #' https://www.indec.gob.ar/ftp/cuadros/menusuperior/eph/EPH_errores_muestreo_3t2014.pdf
 #' https://www.indec.gob.ar/ftp/cuadros/menusuperior/eph/EPH_errores_muestreo.pdf
 #' @format Un data frame con 1687 filas y 5 variables:
 #' \describe{
-#'   \item{\code{codigo}}{character ---String con código numérico de los 31 aglomerados, "Gran Buenos Aires"
-#'    (sólo para 2003.03 a 2014.02), o con "Total" para el conjunto de los 31 aglomerados---}
+#'   \item{\code{codigo}}{character ---String con codigo numerico de los 31 aglomerados, "Gran Buenos Aires"
+#'    (solo para 2003.03 a 2014.02), o con "Total" para el conjunto de los 31 aglomerados---}
 #'   \item{\code{aglomerado}}{character ---String con el nombre del aglomerado---}
 #'   \item{\code{periodo}}{character ---String indicando el periodo de EPH que corresponde, "2014.03"
 #'    para datos de EPH a partir del tercer trimestre 2014, o "2003.03_2014.02" para datos anteriores---}
-#'   \item{\code{x}}{double ---Estimación de población para la cual se desea conocer el error muestral---}
-#'   \item{\code{ds}}{double ---Desvío Estándar correspondiente a la estimación de población en el aglomerado---}
-#'   \item{\code{cv}}{double ---Coeficiente de Variación correspondiente a la estimación de población en el aglomerado---}
+#'   \item{\code{x}}{double ---Estimacion de poblacion para la cual se desea conocer el error muestral---}
+#'   \item{\code{ds}}{double ---Desvio Estandar correspondiente a la estimacion de poblacion en el aglomerado---}
+#'   \item{\code{cv}}{double ---Coeficiente de Variacion correspondiente a la estimacion de poblacion en el aglomerado---}
 #' }
 
 "errores_muestrales"
diff --git a/R/get_eahu.R b/R/get_eahu.R
@@ -77,7 +77,7 @@ get_eahu <- function(year = 2010,
       dplyr::mutate(filter_col = purrr::map_lgl(error, ~ !is.null(.x))) %>%
       dplyr::filter(filter_col) %>%
       dplyr::mutate(error_message = purrr::map(error, ~ purrr::pluck(.x, 1))) %>%
-      dplyr::select(-any_of(c("microdata", "error"))) %>%
+      dplyr::select(-tidyselect::any_of(c("microdata", "error"))) %>%
       tidyr::unnest(cols = c(error_message))
 
     if (nrow(errors) > 0) {
@@ -88,7 +88,7 @@ get_eahu <- function(year = 2010,
     }
 
     df <- df %>%
-      dplyr::select(-any_of(c("error")))
+      dplyr::select(-tidyselect::any_of(c("error")))
 
     if (!is.null(destfile) & !destfile_exists) {
       saveRDS(df, file = destfile)
@@ -100,6 +100,6 @@ get_eahu <- function(year = 2010,
   } else {
     df %>%
       tidyr::unnest(microdata) %>%
-      dplyr::select(-any_of(c("year", "type")))
+      dplyr::select(-tidyselect::any_of(c("year", "type")))
   }
 }
diff --git a/R/get_eahu_internal.R b/R/get_eahu_internal.R
@@ -61,7 +61,7 @@ get_eahu_internal <- function(year = 2010,
 
     base <- base %>%
       dplyr::rename_all(toupper) %>%
-      dplyr::select(all_of(vars))
+      dplyr::select(tidyselect::all_of(vars))
 
     return(base)
   }

diff --git a/R/get_microdata.R b/R/get_microdata.R
@@ -98,7 +98,7 @@ get_microdata <- function(year = 2018,
       dplyr::mutate(filter_col = purrr::map_lgl(error, ~ !is.null(.x))) %>%
       dplyr::filter(filter_col) %>%
       dplyr::mutate(error_message = purrr::map(error, ~ purrr::pluck(.x, 1))) %>%
-      dplyr::select(-any_of(c("microdata", "error"))) %>%
+      dplyr::select(-tidyselect::any_of(c("microdata", "error"))) %>%
       tidyr::unnest(cols = c(error_message))
 
     if (nrow(errors) > 0) {
@@ -109,7 +109,7 @@ get_microdata <- function(year = 2018,
     }
 
     df <- df %>%
-      dplyr::select(-any_of(c("error")))
+      dplyr::select(-tidyselect::any_of(c("error")))
 
     if (!is.null(destfile) & !destfile_exists) {
       saveRDS(df, file = destfile)
@@ -121,6 +121,6 @@ get_microdata <- function(year = 2018,
   } else {
     df %>%
       tidyr::unnest(microdata) %>%
-      dplyr::select(-any_of(c("year", "period", "type")))
+      dplyr::select(-tidyselect::any_of(c("year", "period", "type")))
   }
 }
diff --git a/R/get_microdata_internal.R b/R/get_microdata_internal.R
@@ -198,7 +198,7 @@ Mas informacon en: https://www.indec.gob.ar/ftp/cuadros/sociedad/anexo_informe_e
 
     base %>%
       dplyr::rename_all(toupper) %>%
-      dplyr::select(all_of(vars))
+      dplyr::select(tidyselect::all_of(vars))
   } else {
     base
   }

diff --git a/R/get_total_urbano.R b/R/get_total_urbano.R
@@ -77,7 +77,7 @@ get_total_urbano <- function(year = 2016,
       dplyr::mutate(filter_col = purrr::map_lgl(error, ~ !is.null(.x))) %>%
       dplyr::filter(filter_col) %>%
       dplyr::mutate(error_message = purrr::map(error, ~ purrr::pluck(.x, 1))) %>%
-      dplyr::select(-any_of(c("microdata", "error"))) %>%
+      dplyr::select(-tidyselect::any_of(c("microdata", "error"))) %>%
       tidyr::unnest(cols = c(error_message))
 
     if (nrow(errors) > 0) {
@@ -88,7 +88,7 @@ get_total_urbano <- function(year = 2016,
     }
 
     df <- df %>%
-      dplyr::select(-any_of(c("error")))
+      dplyr::select(-tidyselect::any_of(c("error")))
 
     if (!is.null(destfile) & !destfile_exists) {
       saveRDS(df, file = destfile)
@@ -100,6 +100,6 @@ get_total_urbano <- function(year = 2016,
   } else {
     df %>%
       tidyr::unnest(microdata) %>%
-      dplyr::select(-any_of(c("year", "type")))
+      dplyr::select(-tidyselect::any_of(c("year", "type")))
   }
 }
diff --git a/R/get_total_urbano_internal.R b/R/get_total_urbano_internal.R
@@ -81,7 +81,7 @@ get_total_urbano_internal <- function(year = 2016,
 
     base <- base %>%
       dplyr::rename_all(toupper) %>%
-      dplyr::select(all_of(vars))
+      dplyr::select(tidyselect::all_of(vars))
 
     return(base)
   }

diff --git a/R/is_in_github.R b/R/is_in_github.R
@@ -28,7 +28,7 @@ is_in_github <- function(year = 2018,
       {
         req <- httr::GET("https://api.github.com/repos/holatam/data/git/trees/master?recursive=1")
 
-        filelist <- unlist(lapply(httr::content(req)$tree, "[", "path"), use.names = F)
+        filelist <- unlist(lapply(httr::content(req)$tree, "[", "path"), use.names = FALSE)
 
         looking_for <- sprintf("eph/%s/base_%s_%sT%s.RDS", type, type, year, period)
 

diff --git a/R/organize_cno.R b/R/organize_cno.R
@@ -7,7 +7,7 @@
 #' @return Devuelve la base con 4 columnas nuevas (ver `CNO`)
 #'
 #' @details
-#' Importante: Verificar que el clasificador CNO 2001 sea compatible con la base que estés utilizando.
+#' Importante: Verificar que el clasificador CNO 2001 sea compatible con la base que estes utilizando.
 #'
 #' disclaimer: El script no es un producto oficial de INDEC.
 #'
@@ -64,7 +64,7 @@ organize_cno <- function(base) {
     dplyr::left_join(., calificacion,
       by = c("DIGIT5" = "value")
     ) %>%
-    dplyr::select(-any_of(c("CLASIF_CNO", "DIGIT12", "DIGIT3", "DIGIT4", "DIGIT5")))
+    dplyr::select(-tidyselect::any_of(c("CLASIF_CNO", "DIGIT12", "DIGIT3", "DIGIT4", "DIGIT5")))
 
 
 

diff --git a/R/organize_panels.R b/R/organize_panels.R
@@ -1,7 +1,7 @@
 #'  Pool de Datos en Panel - Base Individudal EPH continua
 #'
 #' Permite armar un pool de datos en panel de la EPH continua a partir
-#' de especificar una serie consecutiva de bases, variables y el largo de la ventana -window- de observación
+#' de especificar una serie consecutiva de bases, variables y el largo de la ventana -window- de observacion
 #'
 #' @param bases Lista de bases de microdatos a utilizar para armar el pool de datos
 #' @param variables Vector con nombres de las variables de interes
@@ -32,7 +32,7 @@ organize_panels <- function(bases, variables, window = "anual") {
   }
 
   bases_continua <- dplyr::bind_rows(bases) %>%
-    dplyr::select(all_of(c("CODUSU", "NRO_HOGAR", "COMPONENTE",
+    dplyr::select(tidyselect::all_of(c("CODUSU", "NRO_HOGAR", "COMPONENTE",
                   "ANO4", "TRIMESTRE", "CH04", "CH06", variables))) %>%
     dplyr::filter(ESTADO != 0) %>%
     dplyr::mutate(Periodo = zoo::as.yearqtr(paste0(ANO4, " Q", TRIMESTRE)))
@@ -43,7 +43,7 @@ organize_panels <- function(bases, variables, window = "anual") {
     paste0(x, "_t1")
   }
 
-  ## En Base a la amplitud del panel que especificaré al correr en la funcion resto en la Base
+  ## En Base a la amplitud del panel que especificare al correr en la funcion resto en la Base
   ## Replica el identificador de Trimestre construido, para hacer un join  con la Base.
 
   bases_continua_join <- bases_continua %>%