Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Traduccion lina #33

Conversation

LinaMorenoAzocar
Copy link

Capítulos Workflow-scripts e Import traducidos, borré los archivos que había agregado pero me siguen apareciendo en mi repositorio... Algunos detalles a corregir;
-en Scripts, en en nro 13 aparece un llamado en el texto a una parte del chunk, y no supe hacerlo igual.
-En Import, hay algunos términos más de lenguaje de programación que no conocía cómo traducirlos y requieren revisión de alguien que sepa!

Hay un par de términos que tengo en duda por ser más de programación/slang.
la base de datos challenge.csv tiene columnas x e y, no sé si es necesario subir el archivo con el nombre en español?
…te del chunk a continuación. No supe cómo hacer eso.
@rivaquiroga
Copy link
Member

Revisión de la traducción:. Las personas encargadas de revisarla serán @luisDVA y @gvegayon. En este documento se encuentran las orientaciones sobre cómo hacer los comentarios y sugerencias. Cualquier duda que les surja, pueden plantearla acá o por el Slack.
@pachamaltese, Lina resolvió el problema que había antes, y la traducción ahora está en los archivos orginales. Sin embargo, quedaron copias de los archivos que creó ella. ¿Puedes eliminarlos para que quienes revisen no se confundan? Los que habría que borrar son "workflow-scripts - traducido.Rmd" e "import traducción.Rmd".
¡Muchas gracias!

---
# Flujo de trabajo: *Scripts*

Hasta ahora estuviste utilizando la consola para ejecutar c�digo. Ese es un buen punto de partida, pero ver�s que se
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Éste en lugar de Ese?

# Flujo de trabajo: *Scripts*

Hasta ahora estuviste utilizando la consola para ejecutar c�digo. Ese es un buen punto de partida, pero ver�s que se
vuelve estrecho r�pidamente a medida que creas gr�ficos de **ggplot2** m�s complejos y *pipes* (/paip/, del ingl�s *tubo*) en **dplyr**. Para tener m�s espacio de trabajo, una buena idea es usar el editor de *script*. �brelo ya sea haciendo clic en el men� de Archivo (*File*), seleccionando Nuevo Archivo (*New File*), luego Script de R (*R Script*), o utilizando el atajo del teclado Cmd/Ctrl + Shift + N. Ahora ver�s cuatro paneles:
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

reemplazar estrecho con incómodo

```{r echo = FALSE, out.width = "75%"}
knitr::include_graphics("diagrams/rstudio-editor.png")
```
El editor de *script* es un excelente espacio para colocar el c�digo que te interesa. Contin�a experimentando en la consola, pero una vez que has escrito un c�digo que funciona y hace lo que quieres, col�calo en el editor de *script*. Rstudio guardar� autom�ticamente los contenidos del editor cuando salgas del programa, y los cargar� autom�ticamente cuando vuelvas a abrirlo. De todos modos, es una buena idea que guardes los *scripts* regularmente y para respaldarlos.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

De todos modos <- De igual manera

import.Rmd Show resolved Hide resolved
import.Rmd Outdated
* They produce tibbles, they don't convert character vectors to factors,
use row names, or munge the column names. These are common sources of
frustration with the base R functions.
* Producen tibbles, no convierten los vectores de caracteres a factores, usan nombres de filas ni distorsionan los nombres de columnas. Estas son fuentes comunes de frustración con las funciones de R base.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

no usan nombres de filas ni...

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

modifico, gracias!

import.Rmd Outdated
to read the following text into a data frame?
1. ¿Qué función utilizarías para leer un archivo donde los campos están separados con "|"?

1. Además de `file`, `skip` y `comment` ¿Qué otros argumentos tienen en común `read_csv()` y `read_tsv`?
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

read_tsv()

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

! gracias!

import.Rmd Outdated

```{r}
parse_double("1.23")
parse_double("1,23", locale = locale(decimal_mark = ","))
```
El locale por defecto de **readr** es EEUU-céntrico, porque generalmente R es EEUU-céntrico (i.e. la documentación de R base está escrita en inglés americano). Una aproximación alternativa podría ser probar y adivinar las opciones por defecto de tu sistema operativo. Es difícil de hacerlo bien, y lo que es más importante, hace que tu código sea frágil. Incluso si funciona en tu computadora, puede fallar cuando lo envíes a un colega en otro país.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Ésto es difícil de hacer bien,

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

no estoy segura, pero me parece mejor que mi traducción... lo modifico

import.Rmd Outdated

1. Numbers are often surrounded by other characters that provide some
context, like "$1000" or "10%".
Pareciera que segmentar un número debiera ser sencillo, pero hay tres problemas que pueden complicarlo:
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

complicar el proceso

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

ok

import.Rmd Outdated

1. A menudo los números están rodeados por otros caracteres que proporcionan algún contexto, como "$1000" o "10%".

1. Los números frecuentemente contienen caracteres de "agrupación", haciéndolos más fáciles de leer, como "1,000,000". y esos caracteres de agrupación varían alrededor del mundo.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

estos caracteres de agrupación

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

ok

import.Rmd Outdated
### Strings {#readr-strings}
### Cadenas de texto {#readr-strings}

En apariencia, `parse_character()` debería ser realmente simple --- podría tan solo devolver su entrada. Desafortunadamente la vida no es tan simple, dado que existen múltiples formas de representar la misma cadena de texto. Para entender qué está pasando, necesitamos bucear en los detalles de cómo las computadoras representan las cadenas de texto. En R, podemos acceder a la representación subyacente de una cadena de texto empleando `charToRaw()`:
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

bucear -> profundizar

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

hecho!

import.Rmd Outdated

```{r}
charToRaw("Hadley")
```
Cada número hexadecimal representa un byte de información: `48` es H, `61` es a, y así. El mapeo desde un número hexadecimal a caracteres se denomina la codificación, y en este caso la codificación se denomina ASCII. ASCII realiza un gran trabajo representando caracteres ingleses, ya que es la ***American** Standard Code for Information Interchange* (del inglés, Código Americano estandarizado para el intercambio de información).
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

caracteres en inglés <- caracteres ingleses

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

caracteres del inglés

import.Rmd Outdated

Things get more complicated for languages other than English. In the early days of computing there were many competing standards for encoding non-English characters, and to correctly interpret a string you needed to know both the values and the encoding. For example, two common encodings are Latin1 (aka ISO-8859-1, used for Western European languages) and Latin2 (aka ISO-8859-2, used for Eastern European languages). In Latin1, the byte `b1` is "±", but in Latin2, it's "ą"! Fortunately, today there is one standard that is supported almost everywhere: UTF-8. UTF-8 can encode just about every character used by humans today, as well as many extra symbols (like emoji!).
**readr** utiliza UTF-8 en todas partes: asume que tus datos están codificados en UTF-8 cuando los lee, y lo emplea siempre cuando los escribe. Esta es una buena opción por defecto, pero fallará con datos producidos por sistemas más viejos que no entienden UTF-8. Si te sucede esto, tus cadenas de texto se verán raras cuando las imprimas en la consola. Algunas veces solo uno o dos caracteres estarán errados. Otras veces obtendrás un total geroglífico. Por ejemplo:
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

jeroglífico

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

gracias! OMG!

import.Rmd Outdated

```{r}
parse_character(x1, locale = locale(encoding = "Latin1"))
parse_character(x2, locale = locale(encoding = "Shift-JIS"))
```

How do you find the correct encoding? If you're lucky, it'll be included somewhere in the data documentation. Unfortunately, that's rarely the case, so readr provides `guess_encoding()` to help you figure it out. It's not foolproof, and it works better when you have lots of text (unlike here), but it's a reasonable place to start. Expect to try a few different encodings before you find the right one.
¿Cómo encontrarás la codificación correcta? Si tienes suerte, estará incluida en alguna parte de la documentación de los datos. Desafortunadamente raras veces es ese el caso, así que **readr** posee `guess_encoding()` para ayudarte a adivinarla. No es a prueba de tontos, y funciona mejor cuando tienes mucho texto (a diferencia de aquí), pero es un punto de inicio razonable. Debes esperar varias pruebas con diferentes codificaciones antes de encontrar la correcta.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Anticipa que probablemente harás varias pruebas con diferentes...

import.Rmd Outdated
: `%S` segundos enteros.
: `%OS` segundos reales.
: `%Z` Zona horaria (como nombre, e.g. `America/Chicago`). Advertencia sobre abreviaturas:
si eres americano, ten en cuenta que "EST" es una zona horaria canadiense que no tiene cambios de horario.¡**No** es la hora Estandar del Este! Volveremos sobre esto [zonas horarias].
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Retomaremos ésto

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

ok, ésto (los pronombres demostrativos y el adverbio solo, en realidad) ya no lleva acento segun la rae (aunque yo lo hubiera puesto igual!) http://www.rae.es/consultas/el-adverbio-solo-y-los-pronombres-demostrativos-sin-tilde

import.Rmd Outdated
Every `parse_xyz()` function has a corresponding `col_xyz()` function. You use `parse_xyz()` when the data is in a character vector in R already; you use `col_xyz()` when you want to tell readr how to load the data.
Cada función `parse_xyz()` tiene su correspondiente función `col_xyz()`. Utilizas `parse_xyz()` cuando los datos se encuentran en un vector de caracteres que ya está disponible en R, usas `col_xyz` cuando quieres decirle a **readr** cómo cargar los datos.

Recomiendo fuertemente proporcionar siempre `col_types`, estructurándolos a partir de la impresión en consola provista por **readr**. Esto asegura que tienes un script para importar datos consistente y reproducible. Si confías en las deducciones por defecto y tus datos cambian, **readr** continuará leyéndolos. Si quieres ser realmente estricto, emplea `stop_for_problems()` (del inglés, detención cuando hay problemas): Esto devolverá un mensaje de error y detendrá tu script si hay cualquier problema con la segmentación.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

cambiar detención por 'alto' ???

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

"alto cuando hay problemas"? Ok!

import.Rmd Outdated
### Other strategies
Hay unas pocas estrategias generales más para ayudarte a segmentar archivos:

* En el ejemplo previo, simplemente fuimos desafortunados: si miramos solo una fila más que el número por defecto, podemos segmentar correctamente de una sola vez:
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

en un solo intento

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

ok

# Flujo de trabajo: *Scripts*

Hasta ahora estuviste utilizando la consola para ejecutar c�digo. Ese es un buen punto de partida, pero ver�s que se
vuelve estrecho r�pidamente a medida que creas gr�ficos de **ggplot2** m�s complejos y *pipes* (/paip/, del ingl�s *tubo*) en **dplyr**. Para tener m�s espacio de trabajo, una buena idea es usar el editor de *script*. �brelo ya sea haciendo clic en el men� de Archivo (*File*), seleccionando Nuevo Archivo (*New File*), luego Script de R (*R Script*), o utilizando el atajo del teclado Cmd/Ctrl + Shift + N. Ahora ver�s cuatro paneles:
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

incómodo<-estrecho

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

ok!

```{r echo = FALSE, out.width = "75%"}
knitr::include_graphics("diagrams/rstudio-editor.png")
```
El editor de *script* es un excelente espacio para colocar el c�digo que te interesa. Contin�a experimentando en la consola, pero una vez que has escrito un c�digo que funciona y hace lo que quieres, col�calo en el editor de *script*. Rstudio guardar� autom�ticamente los contenidos del editor cuando salgas del programa, y los cargar� autom�ticamente cuando vuelvas a abrirlo. De todos modos, es una buena idea que guardes los *scripts* regularmente y para respaldarlos.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

todas formas

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

ok

## Ejecutando c�digo


El editor de *script* es tambi�n un excelente espacio para desarrollar gr�ficos de **ggplot2** complejos o largas secuencias de manupulaci�n con **dplyr**. La clave para utilizar el editor de *script* efectivamente es memorizar uno de los atajos del teclado m�s importantes: Cmd/Ctrl + Enter. Esto ejecuta la expresi�n actual de R en la consola. Por ejemplo, toma el c�digo de abajo. Si tu cursor est� sobre XX, presionar Cmd/Ctrl + Enter correr� el comando completo que genera `no_cancelado`. Tambi�n mover� el cursor al siguiente enunciado (que comienza con `no_cancelado %>%`). Esto facilita el correr todo tu *script* presionando repetidamente Cmd/Ctrl + Enter.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

manipulación

Copy link
Collaborator

@luisDVA luisDVA left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

añadí algunas sugerencias

@pachadotdev
Copy link
Member

pachadotdev commented Sep 17, 2018 via email

import.Rmd Outdated

In this chapter, you'll learn how to load flat files in R with the __readr__ package, which is part of the core tidyverse.

### Requisitos previos
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Yo entiendo que Prerequisitos es más común. ¿Alguna idea de cómo se está haciendo con los otros capítulos?

import.Rmd Outdated Show resolved Hide resolved
import.Rmd Outdated Show resolved Hide resolved
import.Rmd Outdated Show resolved Hide resolved
import.Rmd Outdated Show resolved Hide resolved
import.Rmd Outdated Show resolved Hide resolved
import.Rmd Outdated Show resolved Hide resolved
import.Rmd Outdated Show resolved Hide resolved
import.Rmd Outdated Show resolved Hide resolved
import.Rmd Outdated Show resolved Hide resolved
import.Rmd Outdated Show resolved Hide resolved
import.Rmd Outdated
@@ -140,122 +123,114 @@ If you've used R before, you might wonder why we're not using `read.csv()`. Ther
read_csv("a;b\n1;3")
```

## Parsing a vector
## segmentando un vector
Copy link
Collaborator

@gvegayon gvegayon Sep 21, 2018

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Creo que en vez de segmentar la traducción debería de ser analizar. Sin embargo, no encuentro traducción directa al español, lo que me lleva a decir que deberíamos mantener el uso de parse/parser. ¿Opinones?

Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Acabo de ver esta lista. Creo que dentro de este contexto analizar cae mejor.

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

pero entonces parsers serían... analizadores?

Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

No estoy seguro :S. Segmentar suena mejor pero creo que no es correcto ¿Qué dice @rivaquiroga al respecto?

import.Rmd Outdated Show resolved Hide resolved

Each hexadecimal number represents a byte of information: `48` is H, `61` is a, and so on. The mapping from hexadecimal number to character is called the encoding, and in this case the encoding is called ASCII. ASCII does a great job of representing English characters, because it's the __American__ Standard Code for Information Interchange.
Las cosas se complican un poco más para lenguajes diferentes del inglés. En los días del comienzo de la computación existían muchos estándares de codificación de caracteres no-ingleses compitiendo, y para interpretar correctamente una cadena de texto, necesitas conocer tanto los valores como la codificación. Por ejemplo, dos codificaciones comunes son Latin1 (aka ISO-8859-1, utilizada para los lenguajes del oeste europeo), y Latin2 (aka ISO-8859-2, utilizados para los lenguajes del Este de Europa). En Latin1, el byte 'b1' es "±", pero en Latin2, ¡es "Ä"! Afortunadamente en la actualidad hay un estándar que tiene soporte casi en todos lados: UTF-8. UTF-8 puede codificar casi cualquier caracter utilizado por los humanos, como también muchos símbolos adicionales (¡como emoji!).
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

aka debería ser también conocido como

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

pero en el libro está como aka ISO- ... como si fuera una sola cosa

Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

aka significa "also known as", por lo que debe ser traducido

import.Rmd Outdated Show resolved Hide resolved
import.Rmd Outdated
Every `parse_xyz()` function has a corresponding `col_xyz()` function. You use `parse_xyz()` when the data is in a character vector in R already; you use `col_xyz()` when you want to tell readr how to load the data.
Cada función `parse_xyz()` tiene su correspondiente función `col_xyz()`. Utilizas `parse_xyz()` cuando los datos se encuentran en un vector de caracteres que ya está disponible en R, usas `col_xyz` cuando quieres decirle a **readr** cómo cargar los datos.

Recomiendo fuertemente proporcionar siempre `col_types`, estructurándolos a partir de la impresión en consola provista por **readr**. Esto asegura que tienes un script para importar datos consistente y reproducible. Si confías en las deducciones por defecto y tus datos cambian, **readr** continuará leyéndolos. Si quieres ser realmente estricto, emplea `stop_for_problems()` (del inglés, detención cuando hay problemas): Esto devolverá un mensaje de error y detendrá tu script si hay cualquier problema con la segmentación.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Recomiendo fuertemente no me suena bien, yo solo usaría recomiendo o sugiero

Copy link
Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

ok, incluí "fuertemente" porque el original dice "I highly recommend always..."

Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Puede ser... que yo diga que algo me suena no significa que sea mejor :). Lo podemos dejar como fuertemente

workflow-scripts.Rmd Outdated Show resolved Hide resolved
Copy link
Collaborator

@gvegayon gvegayon left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

En general esta super! Algunas detalles que pueden tener que ver con diferencias de uso de lenguaje entre paises, pero no más que eso.

@pachadotdev
Copy link
Member

@LinaMorenoAzocar hola, este PR no pasa los test, avísame cuando esté esto corregido

@pachadotdev
Copy link
Member

@LinaMorenoAzocar tengo algunos archivos con conflictos
esto está casi listo, lo dejaré cerrado hasta tener esos archivos ok para hacer el merge

@rivaquiroga
Copy link
Member

@pachamaltese, los archivos workflow-script.Rmd e import.Rmd están listos para el merge. Como tienen conflictos, ¿te parece si abro otro PR que esté actualizado con el último build de traduccion y agregue esos dos archivos ahí? Como lo hice con los archivos pendientes de Juliana. Así Travis no se enoja.

@pachadotdev
Copy link
Member

@rivaquiroga porfa, de ayer los cambios de numeración son breaking changes, mejor otro PR

@rivaquiroga
Copy link
Member

Nuevo PR acá: #82

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

5 participants