Traduccion lina #33

LinaMorenoAzocar · 2018-09-10T17:30:58Z

Capítulos Workflow-scripts e Import traducidos, borré los archivos que había agregado pero me siguen apareciendo en mi repositorio... Algunos detalles a corregir;
-en Scripts, en en nro 13 aparece un llamado en el texto a una parte del chunk, y no supe hacerlo igual.
-En Import, hay algunos términos más de lenguaje de programación que no conocía cómo traducirlos y requieren revisión de alguien que sepa!

Hay un par de términos que tengo en duda por ser más de programación/slang. la base de datos challenge.csv tiene columnas x e y, no sé si es necesario subir el archivo con el nombre en español?

…te del chunk a continuación. No supe cómo hacer eso.

rivaquiroga · 2018-09-10T17:41:14Z

Revisión de la traducción:. Las personas encargadas de revisarla serán @luisDVA y @gvegayon. En este documento se encuentran las orientaciones sobre cómo hacer los comentarios y sugerencias. Cualquier duda que les surja, pueden plantearla acá o por el Slack.
@pachamaltese, Lina resolvió el problema que había antes, y la traducción ahora está en los archivos orginales. Sin embargo, quedaron copias de los archivos que creó ella. ¿Puedes eliminarlos para que quienes revisen no se confundan? Los que habría que borrar son "workflow-scripts - traducido.Rmd" e "import traducción.Rmd".
¡Muchas gracias!

luisDVA · 2018-09-12T02:01:07Z

workflow-scripts - traducido.Rmd

+---
+# Flujo de trabajo: *Scripts*
+
+Hasta ahora estuviste utilizando la consola para ejecutar c�digo. Ese es un buen punto de partida, pero ver�s que se 


Éste en lugar de Ese?

luisDVA · 2018-09-12T02:03:18Z

workflow-scripts - traducido.Rmd

+# Flujo de trabajo: *Scripts*
+
+Hasta ahora estuviste utilizando la consola para ejecutar c�digo. Ese es un buen punto de partida, pero ver�s que se 
+vuelve estrecho r�pidamente a medida que creas gr�ficos de **ggplot2** m�s complejos y *pipes* (/paip/, del ingl�s *tubo*) en **dplyr**. Para tener m�s espacio de trabajo, una buena idea es usar el editor de *script*. �brelo ya sea haciendo clic en el men� de Archivo (*File*), seleccionando Nuevo Archivo (*New File*), luego Script de R (*R Script*), o utilizando el atajo del teclado Cmd/Ctrl + Shift + N. Ahora ver�s cuatro paneles: 


reemplazar estrecho con incómodo

luisDVA · 2018-09-12T02:04:29Z

workflow-scripts - traducido.Rmd

+```{r echo = FALSE, out.width = "75%"}
+knitr::include_graphics("diagrams/rstudio-editor.png")
+```
+El editor de *script* es un excelente espacio para colocar el c�digo que te interesa. Contin�a experimentando en la consola, pero una vez que has escrito un c�digo que funciona y hace lo que quieres, col�calo en el editor de *script*. Rstudio guardar� autom�ticamente los contenidos del editor cuando salgas del programa, y los cargar� autom�ticamente cuando vuelvas a abrirlo. De todos modos, es una buena idea que guardes los *scripts* regularmente y para respaldarlos.


De todos modos <- De igual manera

import.Rmd

luisDVA · 2018-09-13T15:42:39Z

import.Rmd

-* They produce tibbles, they don't convert character vectors to factors,
-  use row names, or munge the column names. These are common sources of
-  frustration with the base R functions.
+* Producen tibbles, no convierten los vectores de caracteres a factores, usan nombres de filas ni distorsionan los nombres de columnas. Estas son fuentes comunes de frustración con las funciones de R base.


no usan nombres de filas ni...

modifico, gracias!

luisDVA · 2018-09-13T15:43:42Z

import.Rmd

-    to read the following text into a data frame?
+1. ¿Qué función utilizarías para leer un archivo donde los campos están separados con "|"?
+
+1. Además de `file`, `skip` y `comment` ¿Qué otros argumentos tienen en común `read_csv()` y `read_tsv`?


luisDVA · 2018-09-13T15:47:00Z

import.Rmd


 ```{r}
 parse_double("1.23")
 parse_double("1,23", locale = locale(decimal_mark = ","))
 ```
+El locale por defecto de **readr** es EEUU-céntrico, porque generalmente R es EEUU-céntrico (i.e. la documentación de R base está escrita en inglés americano). Una aproximación alternativa podría ser probar y adivinar las opciones por defecto de tu sistema operativo. Es difícil de hacerlo bien, y  lo que es más importante, hace que tu código sea frágil. Incluso si funciona en tu computadora, puede fallar cuando lo envíes a un colega en otro país.


Ésto es difícil de hacer bien,

no estoy segura, pero me parece mejor que mi traducción... lo modifico

luisDVA · 2018-09-16T16:35:34Z

import.Rmd

-
-1. Numbers are often surrounded by other characters that provide some
-   context, like "$1000" or "10%".
+Pareciera que segmentar un número debiera ser sencillo, pero hay tres problemas que pueden complicarlo: 


complicar el proceso

luisDVA · 2018-09-16T16:37:14Z

import.Rmd

+
+1. A menudo los números están rodeados por otros caracteres que proporcionan algún contexto, como "$1000" o "10%".
+
+1. Los números frecuentemente contienen caracteres de "agrupación", haciéndolos más fáciles de leer, como "1,000,000". y esos caracteres de agrupación varían alrededor del mundo. 


estos caracteres de agrupación

luisDVA · 2018-09-16T16:38:15Z

import.Rmd

-### Strings {#readr-strings}
+### Cadenas de texto {#readr-strings}
+
+En apariencia, `parse_character()` debería ser realmente simple --- podría tan solo devolver su entrada. Desafortunadamente la vida no es tan simple, dado que existen múltiples formas de representar la misma cadena de texto. Para entender qué está pasando, necesitamos bucear en los detalles de cómo las computadoras representan las cadenas de texto. En R, podemos acceder a la representación subyacente de una cadena de texto empleando `charToRaw()`:


bucear -> profundizar

luisDVA · 2018-09-16T16:41:27Z

import.Rmd


 ```{r}
 charToRaw("Hadley")
 ```
+Cada número hexadecimal representa un byte de información: `48` es H, `61` es a, y así. El mapeo desde un número hexadecimal a caracteres se denomina la codificación, y en este caso la codificación se denomina ASCII. ASCII realiza un gran trabajo representando caracteres ingleses, ya que es la ***American** Standard Code for Information Interchange* (del inglés, Código Americano estandarizado para el intercambio de información).


caracteres en inglés <- caracteres ingleses

caracteres del inglés

luisDVA · 2018-09-16T16:43:10Z

import.Rmd


-Things get more complicated for languages other than English. In the early days of computing there were many competing standards for encoding non-English characters, and to correctly interpret a string you needed to know both the values and the encoding. For example, two common encodings are Latin1 (aka ISO-8859-1, used for Western European languages) and Latin2 (aka ISO-8859-2, used for Eastern European languages). In Latin1, the byte `b1` is "±", but in Latin2, it's "ą"! Fortunately, today there is one standard that is supported almost everywhere: UTF-8. UTF-8 can encode just about every character used by humans today, as well as many extra symbols (like emoji!).
+**readr** utiliza UTF-8 en todas partes: asume que tus datos están codificados en UTF-8 cuando los lee, y lo emplea siempre cuando los escribe. Esta es una buena opción por defecto, pero fallará con datos producidos por sistemas más viejos que no entienden UTF-8. Si te sucede esto, tus cadenas de texto se verán raras cuando las imprimas en la consola. Algunas veces solo uno o dos caracteres estarán errados. Otras veces obtendrás un total geroglífico. Por ejemplo: 


jeroglífico

gracias! OMG!

luisDVA · 2018-09-16T16:45:49Z

import.Rmd


 ```{r}
 parse_character(x1, locale = locale(encoding = "Latin1"))
 parse_character(x2, locale = locale(encoding = "Shift-JIS"))
 ```

-How do you find the correct encoding? If you're lucky, it'll be included somewhere in the data documentation. Unfortunately, that's rarely the case, so readr provides  `guess_encoding()` to help you figure it out. It's not foolproof, and it works better when you have lots of text (unlike here), but it's a reasonable place to start. Expect to try a few different encodings before you find the right one.
+¿Cómo encontrarás la codificación correcta? Si tienes suerte, estará incluida en alguna parte de la documentación de los datos. Desafortunadamente raras veces es ese el caso, así que **readr** posee `guess_encoding()` para ayudarte a adivinarla. No es a prueba de tontos, y funciona mejor cuando tienes mucho texto (a diferencia de aquí), pero es un punto de inicio razonable. Debes esperar varias pruebas con diferentes codificaciones antes de encontrar la correcta.


Anticipa que probablemente harás varias pruebas con diferentes...

luisDVA · 2018-09-16T16:53:43Z

import.Rmd

+: `%S` segundos enteros.
+: `%OS` segundos reales. 
+: `%Z` Zona horaria (como nombre, e.g. `America/Chicago`). Advertencia sobre abreviaturas: 
+  si eres americano, ten en cuenta que "EST" es una zona horaria canadiense que no tiene cambios de horario.¡**No** es la hora Estandar del Este! Volveremos sobre esto [zonas horarias].


Retomaremos ésto

ok, ésto (los pronombres demostrativos y el adverbio solo, en realidad) ya no lleva acento segun la rae (aunque yo lo hubiera puesto igual!) http://www.rae.es/consultas/el-adverbio-solo-y-los-pronombres-demostrativos-sin-tilde

luisDVA · 2018-09-16T17:03:13Z

import.Rmd

-Every `parse_xyz()` function has a corresponding `col_xyz()` function. You use `parse_xyz()` when the data is in a character vector in R already; you use `col_xyz()` when you want to tell readr how to load the data.
+Cada función `parse_xyz()` tiene su correspondiente función `col_xyz()`. Utilizas `parse_xyz()` cuando los datos se encuentran en un vector de caracteres que ya está disponible en R, usas `col_xyz` cuando quieres decirle a **readr** cómo cargar los datos.
+
+Recomiendo fuertemente proporcionar siempre `col_types`, estructurándolos a partir de la impresión en consola provista por **readr**. Esto asegura que tienes un script para importar datos consistente y reproducible. Si confías en las deducciones por defecto y tus datos cambian, **readr** continuará leyéndolos. Si quieres ser realmente estricto, emplea `stop_for_problems()` (del inglés, detención cuando hay problemas): Esto devolverá un mensaje de error y detendrá tu script si hay cualquier problema con la segmentación.


cambiar detención por 'alto' ???

"alto cuando hay problemas"? Ok!

luisDVA · 2018-09-16T17:08:48Z

import.Rmd

-### Other strategies
+Hay unas pocas estrategias generales más para ayudarte a segmentar archivos:
+
+*   En el ejemplo previo, simplemente fuimos desafortunados: si miramos solo una fila más que el número por defecto, podemos segmentar correctamente de una sola vez:


en un solo intento

luisDVA · 2018-09-16T17:56:56Z

workflow-scripts - traducido.Rmd

+# Flujo de trabajo: *Scripts*
+
+Hasta ahora estuviste utilizando la consola para ejecutar c�digo. Ese es un buen punto de partida, pero ver�s que se 
+vuelve estrecho r�pidamente a medida que creas gr�ficos de **ggplot2** m�s complejos y *pipes* (/paip/, del ingl�s *tubo*) en **dplyr**. Para tener m�s espacio de trabajo, una buena idea es usar el editor de *script*. �brelo ya sea haciendo clic en el men� de Archivo (*File*), seleccionando Nuevo Archivo (*New File*), luego Script de R (*R Script*), o utilizando el atajo del teclado Cmd/Ctrl + Shift + N. Ahora ver�s cuatro paneles: 


incómodo<-estrecho

luisDVA · 2018-09-16T17:59:34Z

workflow-scripts - traducido.Rmd

+```{r echo = FALSE, out.width = "75%"}
+knitr::include_graphics("diagrams/rstudio-editor.png")
+```
+El editor de *script* es un excelente espacio para colocar el c�digo que te interesa. Contin�a experimentando en la consola, pero una vez que has escrito un c�digo que funciona y hace lo que quieres, col�calo en el editor de *script*. Rstudio guardar� autom�ticamente los contenidos del editor cuando salgas del programa, y los cargar� autom�ticamente cuando vuelvas a abrirlo. De todos modos, es una buena idea que guardes los *scripts* regularmente y para respaldarlos.


todas formas

luisDVA · 2018-09-16T17:59:55Z

workflow-scripts - traducido.Rmd

+## Ejecutando c�digo
+
+
+El editor de *script* es tambi�n un excelente espacio para desarrollar gr�ficos de **ggplot2** complejos o largas secuencias de manupulaci�n con **dplyr**. La clave para utilizar el editor de *script* efectivamente es memorizar uno de los atajos del teclado m�s importantes: Cmd/Ctrl + Enter. Esto ejecuta la expresi�n actual de R en la consola. Por ejemplo, toma el c�digo de abajo. Si tu cursor est� sobre XX, presionar Cmd/Ctrl + Enter correr� el comando completo que genera `no_cancelado`. Tambi�n mover� el cursor al siguiente enunciado (que comienza con `no_cancelado %>%`). Esto facilita el correr todo tu *script* presionando repetidamente Cmd/Ctrl + Enter.


manipulación

luisDVA

añadí algunas sugerencias

pachadotdev · 2018-09-17T01:41:14Z

Claro, desde el laptop veo aquello y lo resuelvo

…

On Mon, Sep 10, 2018, 2:41 PM Riva Quiroga ***@***.***> wrote: *Revisión de la traducción:*. Las personas encargadas de revisarla serán @luisDVA <https://github.com/luisDVA> y @gvegayon <https://github.com/gvegayon>. En este documento <https://github.com/cienciadedatos/descripcion-y-orientaciones/blob/master/orientaciones-revision.md> se encuentran las orientaciones sobre cómo hacer los comentarios y sugerencias. Cualquier duda que les surja, pueden plantearla acá o por el Slack. @pachamaltese <https://github.com/pachamaltese>, Lina resolvió el problema que había antes, y la traducción ahora está en los archivos orginales. Sin embargo, quedaron copias de los archivos que creó ella. ¿Puedes eliminarlos para que quienes revisen no se confundan? Los que habría que borrar son "workflow-scripts - traducido.Rmd" e "import traducción.Rmd". ¡Muchas gracias! — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub <#33 (comment)>, or mute the thread <https://github.com/notifications/unsubscribe-auth/AJn6OVdmjj_KjAu86yd4JC6Asu4leYbIks5uZqRggaJpZM4Wh2IU> .

gvegayon · 2018-09-21T05:55:23Z

import.Rmd


-In this chapter, you'll learn how to load flat files in R with the __readr__ package, which is part of the core tidyverse.
+
+### Requisitos previos


Yo entiendo que Prerequisitos es más común. ¿Alguna idea de cómo se está haciendo con los otros capítulos?

import.Rmd

gvegayon · 2018-09-21T06:41:14Z

import.Rmd

@@ -140,122 +123,114 @@ If you've used R before, you might wonder why we're not using `read.csv()`. Ther
    read_csv("a;b\n1;3")
    ```

-## Parsing a vector
+## segmentando un vector


Creo que en vez de segmentar la traducción debería de ser analizar. Sin embargo, no encuentro traducción directa al español, lo que me lleva a decir que deberíamos mantener el uso de parse/parser. ¿Opinones?

Acabo de ver esta lista. Creo que dentro de este contexto analizar cae mejor.

pero entonces parsers serían... analizadores?

No estoy seguro :S. Segmentar suena mejor pero creo que no es correcto ¿Qué dice @rivaquiroga al respecto?

import.Rmd

gvegayon · 2018-09-21T07:04:14Z

import.Rmd


-Each hexadecimal number represents a byte of information: `48` is H, `61` is a, and so on. The mapping from hexadecimal number to character is called the encoding, and in this case the encoding is called ASCII. ASCII does a great job of representing English characters, because it's the __American__ Standard Code for Information Interchange.
+Las cosas se complican un poco más para lenguajes diferentes del inglés. En los días del comienzo de la computación existían muchos estándares de codificación de caracteres no-ingleses compitiendo, y  para interpretar correctamente una cadena de texto, necesitas conocer tanto los valores como la codificación. Por ejemplo, dos codificaciones comunes son Latin1 (aka ISO-8859-1, utilizada para los lenguajes del oeste europeo), y Latin2 (aka ISO-8859-2, utilizados para los lenguajes del Este de Europa). En Latin1, el byte 'b1' es "Â±", pero en Latin2, ¡es "Ä"! Afortunadamente en la actualidad hay un estándar que tiene soporte casi en todos lados: UTF-8. UTF-8 puede codificar casi cualquier caracter utilizado por los humanos, como también muchos símbolos adicionales (¡como emoji!).


aka debería ser también conocido como

pero en el libro está como aka ISO- ... como si fuera una sola cosa

aka significa "also known as", por lo que debe ser traducido

import.Rmd

gvegayon · 2018-09-21T07:25:02Z

import.Rmd

-Every `parse_xyz()` function has a corresponding `col_xyz()` function. You use `parse_xyz()` when the data is in a character vector in R already; you use `col_xyz()` when you want to tell readr how to load the data.
+Cada función `parse_xyz()` tiene su correspondiente función `col_xyz()`. Utilizas `parse_xyz()` cuando los datos se encuentran en un vector de caracteres que ya está disponible en R, usas `col_xyz` cuando quieres decirle a **readr** cómo cargar los datos.
+
+Recomiendo fuertemente proporcionar siempre `col_types`, estructurándolos a partir de la impresión en consola provista por **readr**. Esto asegura que tienes un script para importar datos consistente y reproducible. Si confías en las deducciones por defecto y tus datos cambian, **readr** continuará leyéndolos. Si quieres ser realmente estricto, emplea `stop_for_problems()` (del inglés, detención cuando hay problemas): Esto devolverá un mensaje de error y detendrá tu script si hay cualquier problema con la segmentación.


Recomiendo fuertemente no me suena bien, yo solo usaría recomiendo o sugiero

ok, incluí "fuertemente" porque el original dice "I highly recommend always..."

Puede ser... que yo diga que algo me suena no significa que sea mejor :). Lo podemos dejar como fuertemente

workflow-scripts.Rmd

gvegayon

En general esta super! Algunas detalles que pueden tener que ver con diferencias de uso de lenguaje entre paises, pero no más que eso.

pachadotdev · 2018-09-30T16:33:46Z

@LinaMorenoAzocar hola, este PR no pasa los test, avísame cuando esté esto corregido

pachadotdev · 2018-12-19T20:17:04Z

@LinaMorenoAzocar tengo algunos archivos con conflictos
esto está casi listo, lo dejaré cerrado hasta tener esos archivos ok para hacer el merge

rivaquiroga · 2019-05-20T15:01:57Z

@pachamaltese, los archivos workflow-script.Rmd e import.Rmd están listos para el merge. Como tienen conflictos, ¿te parece si abro otro PR que esté actualizado con el último build de traduccion y agregue esos dos archivos ahí? Como lo hice con los archivos pendientes de Juliana. Así Travis no se enoja.

pachadotdev · 2019-05-20T16:47:46Z

@rivaquiroga porfa, de ayer los cambios de numeración son breaking changes, mejor otro PR

rivaquiroga · 2019-05-21T03:30:05Z

Nuevo PR acá: #82

LinaMorenoAzocar added 4 commits July 31, 2018 10:56

descripcion de los cambios

f429189

descripcion de los cambios

ecfc258

traduccion capitulo 11 (import.rmd)

eb21e7b

Hay un par de términos que tengo en duda por ser más de programación/slang. la base de datos challenge.csv tiene columnas x e y, no sé si es necesario subir el archivo con el nombre en español?

en el cienciadedatos#13, dice "si tu cursor está en" y señala una par…

e887a34

…te del chunk a continuación. No supe cómo hacer eso.

LinaMorenoAzocar requested a review from pachadotdev as a code owner September 10, 2018 17:30

gvegayon mentioned this pull request Sep 10, 2018

primera versión capitulo import.rmd (#11) #26

Closed

gvegayon requested review from gvegayon and luisDVA September 10, 2018 23:11

luisDVA reviewed Sep 12, 2018

View reviewed changes

luisDVA reviewed Sep 13, 2018

View reviewed changes

import.Rmd Show resolved Hide resolved

luisDVA reviewed Sep 13, 2018

View reviewed changes

luisDVA reviewed Sep 16, 2018

View reviewed changes