-
Notifications
You must be signed in to change notification settings - Fork 130
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Traduccion lina #33
Traduccion lina #33
Conversation
Hay un par de términos que tengo en duda por ser más de programación/slang. la base de datos challenge.csv tiene columnas x e y, no sé si es necesario subir el archivo con el nombre en español?
…te del chunk a continuación. No supe cómo hacer eso.
Revisión de la traducción:. Las personas encargadas de revisarla serán @luisDVA y @gvegayon. En este documento se encuentran las orientaciones sobre cómo hacer los comentarios y sugerencias. Cualquier duda que les surja, pueden plantearla acá o por el Slack. |
workflow-scripts - traducido.Rmd
Outdated
--- | ||
# Flujo de trabajo: *Scripts* | ||
|
||
Hasta ahora estuviste utilizando la consola para ejecutar c�digo. Ese es un buen punto de partida, pero ver�s que se |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Éste en lugar de Ese?
workflow-scripts - traducido.Rmd
Outdated
# Flujo de trabajo: *Scripts* | ||
|
||
Hasta ahora estuviste utilizando la consola para ejecutar c�digo. Ese es un buen punto de partida, pero ver�s que se | ||
vuelve estrecho r�pidamente a medida que creas gr�ficos de **ggplot2** m�s complejos y *pipes* (/paip/, del ingl�s *tubo*) en **dplyr**. Para tener m�s espacio de trabajo, una buena idea es usar el editor de *script*. �brelo ya sea haciendo clic en el men� de Archivo (*File*), seleccionando Nuevo Archivo (*New File*), luego Script de R (*R Script*), o utilizando el atajo del teclado Cmd/Ctrl + Shift + N. Ahora ver�s cuatro paneles: |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
reemplazar estrecho con incómodo
workflow-scripts - traducido.Rmd
Outdated
```{r echo = FALSE, out.width = "75%"} | ||
knitr::include_graphics("diagrams/rstudio-editor.png") | ||
``` | ||
El editor de *script* es un excelente espacio para colocar el c�digo que te interesa. Contin�a experimentando en la consola, pero una vez que has escrito un c�digo que funciona y hace lo que quieres, col�calo en el editor de *script*. Rstudio guardar� autom�ticamente los contenidos del editor cuando salgas del programa, y los cargar� autom�ticamente cuando vuelvas a abrirlo. De todos modos, es una buena idea que guardes los *scripts* regularmente y para respaldarlos. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
De todos modos <- De igual manera
import.Rmd
Outdated
* They produce tibbles, they don't convert character vectors to factors, | ||
use row names, or munge the column names. These are common sources of | ||
frustration with the base R functions. | ||
* Producen tibbles, no convierten los vectores de caracteres a factores, usan nombres de filas ni distorsionan los nombres de columnas. Estas son fuentes comunes de frustración con las funciones de R base. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
no usan nombres de filas ni...
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
modifico, gracias!
import.Rmd
Outdated
to read the following text into a data frame? | ||
1. ¿Qué función utilizarías para leer un archivo donde los campos están separados con "|"? | ||
|
||
1. Además de `file`, `skip` y `comment` ¿Qué otros argumentos tienen en común `read_csv()` y `read_tsv`? |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
read_tsv()
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
! gracias!
import.Rmd
Outdated
|
||
```{r} | ||
parse_double("1.23") | ||
parse_double("1,23", locale = locale(decimal_mark = ",")) | ||
``` | ||
El locale por defecto de **readr** es EEUU-céntrico, porque generalmente R es EEUU-céntrico (i.e. la documentación de R base está escrita en inglés americano). Una aproximación alternativa podría ser probar y adivinar las opciones por defecto de tu sistema operativo. Es difícil de hacerlo bien, y lo que es más importante, hace que tu código sea frágil. Incluso si funciona en tu computadora, puede fallar cuando lo envíes a un colega en otro país. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Ésto es difícil de hacer bien,
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
no estoy segura, pero me parece mejor que mi traducción... lo modifico
import.Rmd
Outdated
|
||
1. Numbers are often surrounded by other characters that provide some | ||
context, like "$1000" or "10%". | ||
Pareciera que segmentar un número debiera ser sencillo, pero hay tres problemas que pueden complicarlo: |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
complicar el proceso
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
ok
import.Rmd
Outdated
|
||
1. A menudo los números están rodeados por otros caracteres que proporcionan algún contexto, como "$1000" o "10%". | ||
|
||
1. Los números frecuentemente contienen caracteres de "agrupación", haciéndolos más fáciles de leer, como "1,000,000". y esos caracteres de agrupación varían alrededor del mundo. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
estos caracteres de agrupación
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
ok
import.Rmd
Outdated
### Strings {#readr-strings} | ||
### Cadenas de texto {#readr-strings} | ||
|
||
En apariencia, `parse_character()` debería ser realmente simple --- podría tan solo devolver su entrada. Desafortunadamente la vida no es tan simple, dado que existen múltiples formas de representar la misma cadena de texto. Para entender qué está pasando, necesitamos bucear en los detalles de cómo las computadoras representan las cadenas de texto. En R, podemos acceder a la representación subyacente de una cadena de texto empleando `charToRaw()`: |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
bucear -> profundizar
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
hecho!
import.Rmd
Outdated
|
||
```{r} | ||
charToRaw("Hadley") | ||
``` | ||
Cada número hexadecimal representa un byte de información: `48` es H, `61` es a, y así. El mapeo desde un número hexadecimal a caracteres se denomina la codificación, y en este caso la codificación se denomina ASCII. ASCII realiza un gran trabajo representando caracteres ingleses, ya que es la ***American** Standard Code for Information Interchange* (del inglés, Código Americano estandarizado para el intercambio de información). |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
caracteres en inglés <- caracteres ingleses
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
caracteres del inglés
import.Rmd
Outdated
|
||
Things get more complicated for languages other than English. In the early days of computing there were many competing standards for encoding non-English characters, and to correctly interpret a string you needed to know both the values and the encoding. For example, two common encodings are Latin1 (aka ISO-8859-1, used for Western European languages) and Latin2 (aka ISO-8859-2, used for Eastern European languages). In Latin1, the byte `b1` is "±", but in Latin2, it's "ą"! Fortunately, today there is one standard that is supported almost everywhere: UTF-8. UTF-8 can encode just about every character used by humans today, as well as many extra symbols (like emoji!). | ||
**readr** utiliza UTF-8 en todas partes: asume que tus datos están codificados en UTF-8 cuando los lee, y lo emplea siempre cuando los escribe. Esta es una buena opción por defecto, pero fallará con datos producidos por sistemas más viejos que no entienden UTF-8. Si te sucede esto, tus cadenas de texto se verán raras cuando las imprimas en la consola. Algunas veces solo uno o dos caracteres estarán errados. Otras veces obtendrás un total geroglífico. Por ejemplo: |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
jeroglífico
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
gracias! OMG!
import.Rmd
Outdated
|
||
```{r} | ||
parse_character(x1, locale = locale(encoding = "Latin1")) | ||
parse_character(x2, locale = locale(encoding = "Shift-JIS")) | ||
``` | ||
|
||
How do you find the correct encoding? If you're lucky, it'll be included somewhere in the data documentation. Unfortunately, that's rarely the case, so readr provides `guess_encoding()` to help you figure it out. It's not foolproof, and it works better when you have lots of text (unlike here), but it's a reasonable place to start. Expect to try a few different encodings before you find the right one. | ||
¿Cómo encontrarás la codificación correcta? Si tienes suerte, estará incluida en alguna parte de la documentación de los datos. Desafortunadamente raras veces es ese el caso, así que **readr** posee `guess_encoding()` para ayudarte a adivinarla. No es a prueba de tontos, y funciona mejor cuando tienes mucho texto (a diferencia de aquí), pero es un punto de inicio razonable. Debes esperar varias pruebas con diferentes codificaciones antes de encontrar la correcta. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Anticipa que probablemente harás varias pruebas con diferentes...
import.Rmd
Outdated
: `%S` segundos enteros. | ||
: `%OS` segundos reales. | ||
: `%Z` Zona horaria (como nombre, e.g. `America/Chicago`). Advertencia sobre abreviaturas: | ||
si eres americano, ten en cuenta que "EST" es una zona horaria canadiense que no tiene cambios de horario.¡**No** es la hora Estandar del Este! Volveremos sobre esto [zonas horarias]. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Retomaremos ésto
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
ok, ésto (los pronombres demostrativos y el adverbio solo, en realidad) ya no lleva acento segun la rae (aunque yo lo hubiera puesto igual!) http://www.rae.es/consultas/el-adverbio-solo-y-los-pronombres-demostrativos-sin-tilde
import.Rmd
Outdated
Every `parse_xyz()` function has a corresponding `col_xyz()` function. You use `parse_xyz()` when the data is in a character vector in R already; you use `col_xyz()` when you want to tell readr how to load the data. | ||
Cada función `parse_xyz()` tiene su correspondiente función `col_xyz()`. Utilizas `parse_xyz()` cuando los datos se encuentran en un vector de caracteres que ya está disponible en R, usas `col_xyz` cuando quieres decirle a **readr** cómo cargar los datos. | ||
|
||
Recomiendo fuertemente proporcionar siempre `col_types`, estructurándolos a partir de la impresión en consola provista por **readr**. Esto asegura que tienes un script para importar datos consistente y reproducible. Si confías en las deducciones por defecto y tus datos cambian, **readr** continuará leyéndolos. Si quieres ser realmente estricto, emplea `stop_for_problems()` (del inglés, detención cuando hay problemas): Esto devolverá un mensaje de error y detendrá tu script si hay cualquier problema con la segmentación. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
cambiar detención por 'alto' ???
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
"alto cuando hay problemas"? Ok!
import.Rmd
Outdated
### Other strategies | ||
Hay unas pocas estrategias generales más para ayudarte a segmentar archivos: | ||
|
||
* En el ejemplo previo, simplemente fuimos desafortunados: si miramos solo una fila más que el número por defecto, podemos segmentar correctamente de una sola vez: |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
en un solo intento
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
ok
workflow-scripts - traducido.Rmd
Outdated
# Flujo de trabajo: *Scripts* | ||
|
||
Hasta ahora estuviste utilizando la consola para ejecutar c�digo. Ese es un buen punto de partida, pero ver�s que se | ||
vuelve estrecho r�pidamente a medida que creas gr�ficos de **ggplot2** m�s complejos y *pipes* (/paip/, del ingl�s *tubo*) en **dplyr**. Para tener m�s espacio de trabajo, una buena idea es usar el editor de *script*. �brelo ya sea haciendo clic en el men� de Archivo (*File*), seleccionando Nuevo Archivo (*New File*), luego Script de R (*R Script*), o utilizando el atajo del teclado Cmd/Ctrl + Shift + N. Ahora ver�s cuatro paneles: |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
incómodo<-estrecho
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
ok!
workflow-scripts - traducido.Rmd
Outdated
```{r echo = FALSE, out.width = "75%"} | ||
knitr::include_graphics("diagrams/rstudio-editor.png") | ||
``` | ||
El editor de *script* es un excelente espacio para colocar el c�digo que te interesa. Contin�a experimentando en la consola, pero una vez que has escrito un c�digo que funciona y hace lo que quieres, col�calo en el editor de *script*. Rstudio guardar� autom�ticamente los contenidos del editor cuando salgas del programa, y los cargar� autom�ticamente cuando vuelvas a abrirlo. De todos modos, es una buena idea que guardes los *scripts* regularmente y para respaldarlos. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
todas formas
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
ok
workflow-scripts - traducido.Rmd
Outdated
## Ejecutando c�digo | ||
|
||
|
||
El editor de *script* es tambi�n un excelente espacio para desarrollar gr�ficos de **ggplot2** complejos o largas secuencias de manupulaci�n con **dplyr**. La clave para utilizar el editor de *script* efectivamente es memorizar uno de los atajos del teclado m�s importantes: Cmd/Ctrl + Enter. Esto ejecuta la expresi�n actual de R en la consola. Por ejemplo, toma el c�digo de abajo. Si tu cursor est� sobre XX, presionar Cmd/Ctrl + Enter correr� el comando completo que genera `no_cancelado`. Tambi�n mover� el cursor al siguiente enunciado (que comienza con `no_cancelado %>%`). Esto facilita el correr todo tu *script* presionando repetidamente Cmd/Ctrl + Enter. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
manipulación
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
añadí algunas sugerencias
Claro, desde el laptop veo aquello y lo resuelvo
…On Mon, Sep 10, 2018, 2:41 PM Riva Quiroga ***@***.***> wrote:
*Revisión de la traducción:*. Las personas encargadas de revisarla serán
@luisDVA <https://github.com/luisDVA> y @gvegayon
<https://github.com/gvegayon>. En este documento
<https://github.com/cienciadedatos/descripcion-y-orientaciones/blob/master/orientaciones-revision.md>
se encuentran las orientaciones sobre cómo hacer los comentarios y
sugerencias. Cualquier duda que les surja, pueden plantearla acá o por el
Slack.
@pachamaltese <https://github.com/pachamaltese>, Lina resolvió el
problema que había antes, y la traducción ahora está en los archivos
orginales. Sin embargo, quedaron copias de los archivos que creó ella.
¿Puedes eliminarlos para que quienes revisen no se confundan? Los que
habría que borrar son "workflow-scripts - traducido.Rmd" e "import
traducción.Rmd".
¡Muchas gracias!
—
You are receiving this because you were mentioned.
Reply to this email directly, view it on GitHub
<#33 (comment)>,
or mute the thread
<https://github.com/notifications/unsubscribe-auth/AJn6OVdmjj_KjAu86yd4JC6Asu4leYbIks5uZqRggaJpZM4Wh2IU>
.
|
import.Rmd
Outdated
|
||
In this chapter, you'll learn how to load flat files in R with the __readr__ package, which is part of the core tidyverse. | ||
|
||
### Requisitos previos |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Yo entiendo que Prerequisitos es más común. ¿Alguna idea de cómo se está haciendo con los otros capítulos?
import.Rmd
Outdated
@@ -140,122 +123,114 @@ If you've used R before, you might wonder why we're not using `read.csv()`. Ther | |||
read_csv("a;b\n1;3") | |||
``` | |||
|
|||
## Parsing a vector | |||
## segmentando un vector |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Creo que en vez de segmentar la traducción debería de ser analizar. Sin embargo, no encuentro traducción directa al español, lo que me lleva a decir que deberíamos mantener el uso de parse/parser. ¿Opinones?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Acabo de ver esta lista. Creo que dentro de este contexto analizar cae mejor.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
pero entonces parsers serían... analizadores?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
No estoy seguro :S. Segmentar suena mejor pero creo que no es correcto ¿Qué dice @rivaquiroga al respecto?
|
||
Each hexadecimal number represents a byte of information: `48` is H, `61` is a, and so on. The mapping from hexadecimal number to character is called the encoding, and in this case the encoding is called ASCII. ASCII does a great job of representing English characters, because it's the __American__ Standard Code for Information Interchange. | ||
Las cosas se complican un poco más para lenguajes diferentes del inglés. En los días del comienzo de la computación existían muchos estándares de codificación de caracteres no-ingleses compitiendo, y para interpretar correctamente una cadena de texto, necesitas conocer tanto los valores como la codificación. Por ejemplo, dos codificaciones comunes son Latin1 (aka ISO-8859-1, utilizada para los lenguajes del oeste europeo), y Latin2 (aka ISO-8859-2, utilizados para los lenguajes del Este de Europa). En Latin1, el byte 'b1' es "±", pero en Latin2, ¡es "Ä"! Afortunadamente en la actualidad hay un estándar que tiene soporte casi en todos lados: UTF-8. UTF-8 puede codificar casi cualquier caracter utilizado por los humanos, como también muchos símbolos adicionales (¡como emoji!). |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
aka debería ser también conocido como
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
pero en el libro está como aka ISO- ... como si fuera una sola cosa
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
aka significa "also known as", por lo que debe ser traducido
import.Rmd
Outdated
Every `parse_xyz()` function has a corresponding `col_xyz()` function. You use `parse_xyz()` when the data is in a character vector in R already; you use `col_xyz()` when you want to tell readr how to load the data. | ||
Cada función `parse_xyz()` tiene su correspondiente función `col_xyz()`. Utilizas `parse_xyz()` cuando los datos se encuentran en un vector de caracteres que ya está disponible en R, usas `col_xyz` cuando quieres decirle a **readr** cómo cargar los datos. | ||
|
||
Recomiendo fuertemente proporcionar siempre `col_types`, estructurándolos a partir de la impresión en consola provista por **readr**. Esto asegura que tienes un script para importar datos consistente y reproducible. Si confías en las deducciones por defecto y tus datos cambian, **readr** continuará leyéndolos. Si quieres ser realmente estricto, emplea `stop_for_problems()` (del inglés, detención cuando hay problemas): Esto devolverá un mensaje de error y detendrá tu script si hay cualquier problema con la segmentación. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Recomiendo fuertemente no me suena bien, yo solo usaría recomiendo o sugiero
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
ok, incluí "fuertemente" porque el original dice "I highly recommend always..."
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Puede ser... que yo diga que algo me suena no significa que sea mejor :). Lo podemos dejar como fuertemente
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
En general esta super! Algunas detalles que pueden tener que ver con diferencias de uso de lenguaje entre paises, pero no más que eso.
@LinaMorenoAzocar hola, este PR no pasa los test, avísame cuando esté esto corregido |
@LinaMorenoAzocar tengo algunos archivos con conflictos |
@pachamaltese, los archivos |
@rivaquiroga porfa, de ayer los cambios de numeración son breaking changes, mejor otro PR |
Nuevo PR acá: #82 |
Capítulos Workflow-scripts e Import traducidos, borré los archivos que había agregado pero me siguen apareciendo en mi repositorio... Algunos detalles a corregir;
-en Scripts, en en nro 13 aparece un llamado en el texto a una parte del chunk, y no supe hacerlo igual.
-En Import, hay algunos términos más de lenguaje de programación que no conocía cómo traducirlos y requieren revisión de alguien que sepa!