-
Notifications
You must be signed in to change notification settings - Fork 130
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Traduccion capitulo visualizacion de datos #24
Conversation
Maria Florencia D'Andrea, Zulemma Bazurto y Rocío Espada
Revisión de las traducciones: Las personas encargadas de revisar los capítulos incluidos en este pull request serán:
En este documento se encuentran las orientaciones sobre cómo hacer los comentarios y sugerencias a la traducción (la última versión incluye capturas de pantalla ilustrativas). |
|
||
In [exploratory data analysis], you learned how to use plots as tools for _exploration_. When you make exploratory plots, you know---even before looking---which variables the plot will display. You made each plot for a purpose, could quickly look at it, and then move on to the next plot. In the course of most analyses, you'll produce tens or hundreds of plots, most of which are immediately thrown away. | ||
En [análisis de datos exploratorios] aprendistes a usar gráficos como herramientas de *exploración*. Cuando haces gráficos exploratorios, sabes incluso antes de mirar, qué variables mostrará el gráfico. Hicistes cada gráfico con un propósito, lo miraste rápidamente y luego pasaste al siguiente. En el transcurso de la mayoría de los análisis, producirás decenas o cientos de gráficos, muchos de los cuales se desecharán inmediatamente. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Hay un error que se repite, este es, agregarle una s al pretérito perfecto de algunos verbos en segunda persona:
aprendistes a usar gráficos > aprendiste a usar gráficos
Hicistes cada gráfico con un propósito > Hiciste cada gráfico con un propósito
Conversé con alguien y me dijo que en Argentina suelen agregar esa s. Busqué la conjugación de ambos verbos en la RAE y la versión con s al final no existía.
|
||
Now that you understand your data, you need to _communicate_ your understanding to others. Your audience will likely not share your background knowledge and will not be deeply invested in the data. To help others quickly build up a good mental model of the data, you will need to invest considerable effort in making your plots as self-explanatory as possible. In this chapter, you'll learn some of the tools that ggplot2 provides to do so. | ||
Ahora que comprendes tus datos, debes *comunicar* tu conocimiento a los demás. Es probable que tu audiencia no comparta tus conocimientos previos y no esté profundamente involucrada en los datos. Para ayudar a otros a construir rápidamente un buen modelo mental de los datos, deberás invertir un esfuerzo considerable para que tus gráficos se expliquen por sí solos . En este capítulo, aprenderás algunas de las herramientas que proporciona **ggplot2** para hacerlo. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Mi opinión aquí sería tratar de transmitir el mismo mensaje que el texto en inglés, pero no necesariamente traduciendo palabra por palabra. En ese sentido, mi sugerencia para este parráfo es la siguiente:
Ahora que comprendes tus datos, debes comunicar tus descubrimientos a los demás. Es probable que tu audiencia no comparta tus conocimientos previos ni este profundamente familiarizada con tus datos. Por ello, para ayudar a otros a construir un buen modelo mental respecto a tus datos, necesitarás hacer un gran esfuerzo para que tus gráficos se expliquen por si mismos. En este capítulo, aprenderás algunas de las herramientas que proporciona ggplot2 que te ayudarán en esta tarea.
Acá deseo fundamentar mis decisiones.
"Ahora que comprendes tus datos, debes comunicar tu conocimiento a los demás. "
Utilicé descubrimiento en lugar de conocimiento, porque estamos hablando de análisis de datos exploratorio, y me pareció que en ese contexto hablar de descubrimiento hacía sentido. Además, se ocupa de nuevo esa palabra en la siguiente frase.
"Es probable que tu audiencia no comparta tus conocimientos previos y no esté profundamente involucrada en los datos"
Acá preferí hacer hincapié en que los datos a los que nos estamos refiriendo son los que uno esta analizando, sino, me queda la impresión que se esta hablando de los datos en general y no los que estamos analizando. También busqué una traducción menos literal y más concisa.
"Para ayudar a otros a construir rápidamente un buen modelo mental de los datos, deberás invertir un esfuerzo considerable para que tus gráficos se expliquen por sí solos ."
Aquí también creo que en la traducción literal se pierde un poco el mensaje, que se puede transmitir con menos palabras.
"En este capítulo, aprenderás algunas de las herramientas que proporciona ggplot2 para hacerlo."
Me parece que esta frase esta bien, como esta traducida, así que se puede obviar mi sugerencia.
|
||
This chapter focuses on the tools you need to create good graphics. I assume that you know what you want, and just need to know how to do it. For that reason, I highly recommend pairing this chapter with a good general visualisation book. I particularly like [_The Truthful Art_](https://amzn.com/0321934075), by Albert Cairo. It doesn't teach the mechanics of creating visualisations, but instead focuses on what you need to think about in order to create effective graphics. | ||
Este capítulo se centra en las herramientas necesarias para crear buenos gráficos. Supongo que sabes lo que quieres y solo te falta saber cómo hacerlo. Por esa razón, recomiendo combinar este capítulo con un buen libro de visualización general. Me gusta especialmente [_The Truthful Art_](https://amzn.com/0321934075), de Albert Cairo. No enseña la mecánica de crear visualizaciones, sino que se enfoca en lo que necesitas pensar para crear gráficos efectivos. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Quizás usaría complementar en lugar de combinar en
recomiendo combinar este capítulo con un buen libro de visualización general.
Cambiaría pensar por considerar en la última frase.
No enseña la mecánica de crear visualizaciones, sino que se enfoca en lo que necesitas considerar para crear gráficos efectivos.
## Label | ||
## Etiquetas | ||
|
||
El punto de inicio más sencillo para convertir un gráfico exploratorio en un gráfico expositivo es con buenas etiquetas. Agrega etiquetas con la función `labs()`. Este ejemplo agrega un título al gráfico: |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Agrega etiquetas con la función labs()
> Se agregan etiquetas con la función labs()
``` | ||
|
||
The purpose of a plot title is to summarise the main finding. Avoid titles that just describe what the plot is, e.g. "A scatterplot of engine displacement vs. fuel economy". | ||
El propósito del título de un gráfico es resumir el hallazgo principal. Evita títulos que simplemente describen el gráfico, por ejemplo "Diagrama de dispersión del desplazamiento del motor frente al ahorro de combustible". |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
, por ejemplo "Diagrama de ... > , por ejemplo, "Diagrama de ...
caption = "Data from fueleconomy.gov" | ||
title = "La eficiencia en el uso de combustible disminuye con el tamaño del motor", | ||
subtitle = "Los automóviles deportivos de dos asientos son la excepción debido a su peso liviano", | ||
caption = "Datos de fueleconomy.gov" |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
No tengo claro que queda mejor, pero dejo la sugerencia.
caption = "Datos de fueleconomy.gov" > caption = "Datos obtenidos desde fueleconomy.gov"
) | ||
``` | ||
x = "Desplazamiento del motor (L)", | ||
y = "Economía de combustible de carretera (millas)", |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
No tengo claro cual sería la forma más correcta de traducir Highway fuel economy, abajo dejo una sugerencia que creo es más directa. De todas maneras pregunté en slack por la opinión de los demás.
y = "Economía de combustible de carretera (millas)" > y = "Consumo de gasolina en carretera (millas por galón)"
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
En slack al final quedó "Rendimiento de combustible en autopista"
visualize.Rmd
Outdated
> "The simple graph has brought more information to the data analyst’s mind | ||
> than any other device." --- John Tukey | ||
>"Un simple gráfico brinda más información a la mente del analista de datos | ||
>que cualquier otro dispositivo". --- John Tukey |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
- method o tool también pueden usarse como sinónimos de device (https://www.thesaurus.com). Método o herramienta me parecen palabras más cercanas a la frase.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
De acuerdo con cambiar dispositivo por herramienta.
visualize.Rmd
Outdated
|
||
This chapter will teach you how to visualise your data using ggplot2. R has several systems for making graphs, but ggplot2 is one of the most elegant and most versatile. ggplot2 implements the __grammar of graphics__, a coherent system for describing and building graphs. With ggplot2, you can do more faster by learning one system and applying it in many places. | ||
En este capítulo aprenderás cómo visualizar datos usando el paquete **ggplot2**. De los muchos sistemas que posee R para hacer gráficos, **ggplot2** es uno de los más elegantes y versátiles. Esto se debe a que implementa un sistema coherente para describir y construir gráficos, conocido como la __gramática de gráficos__. Con **ggplot2** puedes hacer más cosas en menor tiempo, aprendiendo un único sistema y aplicándolo en muchos lugares |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
- Podría utilizarse en diferentes ámbitos como traducción de in many places.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
De acuerdo con cambiar en muchos lugares por en diferentes ámbitos. Falta también un punto al final de la frase.
|
||
```{r setup} | ||
library(tidyverse) | ||
``` | ||
|
||
That one line of code loads the core tidyverse; packages which you will use in almost every data analysis. It also tells you which functions from the tidyverse conflict with functions in base R (or from other packages you might have loaded). | ||
Esa única línea de código carga el núcleo de tidyverse; compuesto por los paquetes que usarás en casi todos tus análisis de datos. Al correr esta línea verás cuáles funciones de tidyverse pueden tener conflicto con funciones de R base (o de otros paquetes que puedas haber cargado previamente). |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
- En el segundo enunciado, It also tell you puede utilizarse Al correr esta línea también verás.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
De acuerdo con esta revisión. Propongo también de mi parte unas pequeñas modificaciones:
- de tidyverse -> del tidyverse
- eliminar doble espacio en cuáles funciones
El párrafo quedaría entonces:
Esa única línea de código carga el núcleo del tidyverse; compuesto por los paquetes que usarás en casi todos tus análisis de datos. Al correr esta línea también verás cuáles funciones de tidyverse pueden tener conflicto con funciones de R base (o de otros paquetes que puedas haber cargado previamente).
|
||
If we need to be explicit about where a function (or dataset) comes from, we'll use the special form `package::function()`. For example, `ggplot2::ggplot()` tells you explicitly that we're using the `ggplot()` function from the ggplot2 package. | ||
Si necesitamos ser explícitos acerca de dónde viene una función (o un conjunto de datos), usaremos el formato especial `package::function()`. Por ejemplo, `ggplot2::ggplot()` dice explícitamente que estamos usando la función `ggplot()` del paquete ggplot2. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
- Suguiero: Si es necesario especificar la procedencia de una función para If we need to be explicit about where a function
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Estoy de acuerdo con utilizar procedencia en vez de de dónde viene. Para mantener el tono del libro original (donde se conjuga con el nosotros), sugiero la versión siguiente:
Cuando necesitemos especificar la procedencia de una función (o un conjunto de datos), usaremos el formato especial
package::function()
. Por ejemplo,ggplot2::ggplot()
dice explícitamente que estamos usando la funciónggplot()
del paquete ggplot2.
Bueno, si les suena extraño tampoco duden en modificarla.
|
||
With ggplot2, you begin a plot with the function `ggplot()`. `ggplot()` creates a coordinate system that you can add layers to. The first argument of `ggplot()` is the dataset to use in the graph. So `ggplot(data = mpg)` creates an empty graph, but it's not very interesting so I'm not going to show it here. | ||
Para graficar con **ggplot2**, comienzas un gráfico con la función `ggplot()`. `ggplot()` crea un sistema de coordenadas al cual puedes agregar capas. El primer argumento de `ggplot()` es el conjunto de datos para usar en el gráfico. Si corres `ggplot(data = millas)`, obtendrás un gráfico vacío. Como no es muy interesante, no vamos a mostrarlo aquí. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
*Sugiero: Para comenzar a graficar en ggplot2 se utiliza para With ggplot2, you begin a plot with
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Me parece bien esta sugerencia, aunque remplazaría en ggplot2 por con ggplot2 (la primera versión da la impresión que se trata de un GUI, y no de un paquete).
El párrafo quedaría:
Para comenzar un gráfico con ggplot2 se utiliza la función
ggplot()
.ggplot()
crea un sistema de coordenadas al cual puedes agregar capas. El primer argumento deggplot()
es el conjunto de datos para usar en el gráfico. Si corresggplot(data = millas)
, obtendrás un gráfico vacío. Como no es muy interesante, no vamos a mostrarlo aquí.
|
||
You complete your graph by adding one or more layers to `ggplot()`. The function `geom_point()` adds a layer of points to your plot, which creates a scatterplot. ggplot2 comes with many geom functions that each add a different type of layer to a plot. You'll learn a whole bunch of them throughout this chapter. | ||
Para completar tu gráfico debes agregar una o más capas a `ggplot()`. La función `geom_point()` agrega una capa de puntos al gráfico, que crea un diagrama de dispersión (*scatterplot*). **ggplot2** incluye muchas funciones llamadas geom, cada una de las cuales agrega un tipo de capa diferente a un gráfico. Aprenderás sobre muchas de ellas a lo largo de este capítulo. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
- A partir del segundo enunciado sugiero: La función
geom_point()
agrega una capa de puntos al gráfico creando un diagrama de dispersión (scatterplot). A lo largo de este capítulo aprenderás mucho sobre las funciones geom incluidas en ggplot, con las cuales podrás agregar un tipo de capa diferente a tu gráfico.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Considero que es mejor mantener una traducción más cercana al texto original. Sugiero la traducción siguiente:
Para completar tu gráfico debes agregar una o más capas a
ggplot()
. La funcióngeom_point()
agrega una capa de puntos al gráfico creando un diagrama de dispersión (scatterplot). ggplot2 incluye muchas funciones geom, cada una de las cuales agrega un tipo de capa diferente a un grafico. Aprenderás muchas de ellas a lo largo de este capitulo.
``` | ||
|
||
The rest of this chapter will show you how to complete and extend this template to make different types of graphs. We will begin with the `<MAPPINGS>` component. | ||
El resto de este capítulo te mostrará cómo utilizar y adaptar esta planilla para crear diferentes tipos de gráficos. Comenzaremos por el componente `<MAPEOS>` |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
- Plantilla por planilla.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
OK, quedaría:
Una planilla de gráficos
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Una disculpa, no lo escribí claramente. En la segunda aparición de planilla creo que debería usarse plantilla, para dar a entender que se puede tener un "molde" para gráficos.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
OK, no hay problema 👌
Retenemos entonces el titulo original en la linea 73:
Una plantilla de gráficos
Y cambiamos planilla por plantilla en la linea 82:
El resto de este capítulo te mostrará cómo utilizar y adaptar esta plantilla para crear diferentes tipos de gráficos. Comenzaremos por el componente
<MAPEOS>
@@ -122,60 +120,61 @@ ggplot() + | |||
theme(aspect.ratio = 1/3) | |||
``` | |||
|
|||
You can convey information about your data by mapping the aesthetics in your plot to the variables in your dataset. For example, you can map the colors of your points to the `class` variable to reveal the class of each car. | |||
El mapeo de las propiedades estéticas en tus gráficos a las variables en tu conjunto de datos te permite comunicar información de los mismos. Por ejemplo, puedes asignar los colores de tus puntos a la variable `clase` para revelar la clase de cada automóvil. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
- Sugerencia: El establecer una relación entre las propiedades estéticas del gráfico y las variables del conjunto de datos te permite transmitir información de los mismos . Por ejemplo, puedes asignar los colores de los puntos de acuerdo con la variable
clase
para indicar la clase de cada automóvil.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
De acuerdo con la sugerencia, pero veo dos versiones según si decidimos privilegiar o no el término mapeo (ver comentario anterior).
Version 1 - sin "mapeo":
El establecer una relación entre las propiedades estéticas del gráfico y las variables del conjunto de datos te permite transmitir información de los mismos . Por ejemplo, puedes asignar los colores de los puntos de acuerdo con la variable
clase
para indicar la clase de cada automóvil.
Version 2 - con "mapeo":
El mapeo entre las propiedades estéticas del gráfico y las variables del conjunto de datos te permite transmitir información de los mismos . Por ejemplo, puedes asignar los colores de los puntos de acuerdo con la variable
clase
para indicar la clase de cada automóvil.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
¿No valdría la visualización en este contexto?,
La visualización entre las propiedades estéticas del gráfico y las ...
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Según lo acordado en el Slack, retenemos mapeo. Si les parece, propongo entonces que dejemos la versión 2:
El mapeo entre las propiedades estéticas del gráfico y las variables del conjunto de datos te permite transmitir información de los mismos . Por ejemplo, puedes asignar los colores de los puntos de acuerdo con la variable
clase
para indicar la clase de cada automóvil.
|
||
Each geom function in ggplot2 takes a `mapping` argument. This defines how variables in your dataset are mapped to visual properties. The `mapping` argument is always paired with `aes()`, and the `x` and `y` arguments of `aes()` specify which variables to map to the x and y axes. ggplot2 looks for the mapped variable in the `data` argument, in this case, `mpg`. | ||
Cada función geom en **ggplot2** tiene un argumento de `mapping`. Este define cómo se asignan o se “mapean” las variables del conjunto de datos a propiedades visuales. El argumento de `mapping` siempre aparece emparejado con `aes()`, y los argumentos `x` e `y` dentro de `aes()` especifican qué variables asignar a los ejes x e y. **ggplot2** busca la variable asignada en el argumento `data`, en este caso, `millas`. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
- A partir de este párrafo se utilizan mapear, mapeos a lo largo del texto. Creo que se podrían utilizar establecer una relación o asignar (como en la mayoría de los casos ya se utiliza) cuando se trate del verbo y utilizar mapeos cuando se trate del componente del comando. ¿Qué opinan?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Yo prefiero retener mapear a asignar, para evitar luego confusiones con assignment (<-
) cuando sea introducido luego en otros capítulos. ¿Qué opinas @flor14 ?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
En mi opinión mapear estaría ligado y podría confundir a la hora de generar de mapas. En cambio si se usa "visualizar" quedaría algo como:
Cada función geom en ggplot2 tiene un argumento de mapping
. Este argumento define cómo se asignan o se “visualizan” las variables del conjunto de datos, según sus propiedades visuales.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Según lo acordado en el Slack, retendremos mapear, agregando una explicación donde sea necesario. Dejo abajo mi proposición. Respecto al original cambian dos cosas:
- Se cambia el orden de se asignan y se mapean, para darle prioridad al segundo.
- Reemplazo las
“”
por""
(ver este comentario).
Cada función geom en ggplot2 tiene un argumento de
mapping
. Este define cómo se mapean o se asignan las variables del conjunto de datos a propiedades visuales. El argumento demapping
siempre aparece emparejado conaes()
, y los argumentosx
ey
dentro deaes()
especifican qué variables asignar a los ejes x e y. ggplot2 busca la variable asignada en el argumentodata
, en este caso,millas
.
1. `hwy`, a car's fuel efficiency on the highway, in miles per gallon (mpg). | ||
A car with a low fuel efficiency consumes more fuel than a car with a high | ||
fuel efficiency when they travel the same distance. | ||
2-`autopista`. La eficiencia del uso de combustible de un automóvil en la carretera, en millas por galón. Sobre la misma distancia, un automóvil de baja eficiencia consume más combustible que un automóvil de alta eficiencia. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
- En el segundo enunciado sugiero usar Al recorrer la misma distancia en lugar de Sobre la misma distancia.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
De acuerdo. Aquí la nueva versión del segundo enunciado:
autopista
. La eficiencia del uso de combustible de un automóvil en la carretera, en millas por galón. Al recorrer la misma distancia, un automóvil de baja eficiencia consume más combustible que un automóvil de alta eficiencia.
@flor14 Tengo una duda respecto a las enumeraciones. Veo que en el .Rmd
original, las listas ordenadas tienen todos los elementos en 1.
. ¿Es posible sea esto lo que genere algunos de los errores en los test automáticos?
|
||
This chapter will teach you how to visualise your data using ggplot2. R has several systems for making graphs, but ggplot2 is one of the most elegant and most versatile. ggplot2 implements the __grammar of graphics__, a coherent system for describing and building graphs. With ggplot2, you can do more faster by learning one system and applying it in many places. | ||
En este capítulo aprenderás cómo visualizar datos usando el paquete **ggplot2**. De los muchos sistemas que posee R para hacer gráficos, **ggplot2** es uno de los más elegantes y versátiles. Esto se debe a que implementa un sistema coherente para describir y construir gráficos, conocido como la __gramática de gráficos__. Con **ggplot2** puedes hacer más cosas en menor tiempo, aprendiendo un único sistema y aplicándolo en muchos lugares |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Si al comenzar con: En este capítulo aprenderás cómo visualizar [tus] datos usando el paquete ggplot2, creo que queda mejor ya que hay un sentido de pertenencia del trabajo que lo rescatan los autores en Inglés (your data instead of just data or some data).
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
En el segundo punto seguido donde dice: " Esto se debe a que implementa un sistema coherente para describir y construir gráficos"...como proviene de una frase en la que se compara R base y ggplot2, queda un poco suelto quién es el que implementa el sistema coherente.
Yo agregaría:
Esto se debe a que ggplot2 implementa un sistema coherente para describir y construir gráficos
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Estoy de acuerdo con los comentarios de @a-saza y @ajcanepa. Faltaría que validación de la parte de @flor14. La versión definitiva del párrafo sería entonces:
En este capítulo aprenderás cómo visualizar tus datos usando el paquete ggplot2. De los muchos sistemas que posee R para hacer gráficos, ggplot2 es uno de los más elegantes y versátiles. Esto se debe a que ggplot2 implementa un sistema coherente para describir y construir gráficos, conocido como la gramática de gráficos. Con ggplot2 puedes hacer más cosas en menor tiempo, aprendiendo un único sistema y aplicándolo en diferentes ámbitos.
@@ -413,11 +395,11 @@ ggplot(df, aes(x, y)) + | |||
coord_fixed() | |||
``` | |||
|
|||
Note that all colour scales come in two variety: `scale_colour_x()` and `scale_fill_x()` for the `colour` and `fill` aesthetics respectively (the colour scales are available in both UK and US spellings). | |||
Ten en cuenta que todas las escalas de color vienen en dos variedades: `scale_colour_x()` y `scale_fill_x()` para la estética `color` y `fill`, respectivamente (las escalas de color se expresan tanto en inglés americano como británico). |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
las escalas de color se expresan tanto en inglés americano como británico > las escalas de color están disponibles tanto en inglés americano como británico
|
||
1. Change the display of the presidential terms by: | ||
3. Cambia la visualización de los términos presidenciales de las siguientes maneras: |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Aquí, term se refiere a mandato presidencial no a término.
Cambia la visualización de los términos presidenciales de las siguientes maneras: > Modifica la visualización de los mandatos presidenciales de la siguiente manera:
1. Placing breaks every 4 years (this is trickier than it seems!). | ||
I. Combinando las dos variantes que se muestran arriba. | ||
II. Mejorando la visualización del eje y. | ||
III. Etiquetando cada término con el nombre del presidente. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Etiquetando cada término con el nombre del presidente. > Etiquetando cada mandato presidencial con el nombre del presidente.
I. Combinando las dos variantes que se muestran arriba. | ||
II. Mejorando la visualización del eje y. | ||
III. Etiquetando cada término con el nombre del presidente. | ||
IV. Agregandoetiquetas informativas al gráfico. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Agregandoetiquetas > Agregando etiquetas
|
||
1. Use `override.aes` to make the legend on the following plot easier to see. | ||
4. Utiliza `override.aes` para que la leyenda en el siguiente gráfico sea más fácil de ver: |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Utiliza override.aes
para que la leyenda en el siguiente gráfico sea más fácil de ver: > Utiliza override.aes
para que la leyenda del siguiente gráfico sea más fácil de ver:
1. Setting the limits in each scale | ||
1. Setting `xlim` and `ylim` in `coord_cartesian()` | ||
1. Modificando los datos que se grafican | ||
2. Estableciendo los límites en cada escala |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Estableciendo los límites en cada escala > Estableciendo los límites de cada escala
|
||
To zoom in on a region of the plot, it's generally best to use `coord_cartesian()`. Compare the following two plots: | ||
Para ampliar una región del gráfico, generalmente es mejor usar `coord_cartesian()`.Compara los siguientes dos gráficos: |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
generalmente > por lo general
geom_smooth() | ||
``` | ||
|
||
You can also set the `limits` on individual scales. Reducing the limits is basically equivalent to subsetting the data. It is generally more useful if you want _expand_ the limits, for example, to match scales across different plots. For example, if we extract two classes of cars and plot them separately, it's difficult to compare the plots because all three scales (the x-axis, the y-axis, and the colour aesthetic) have different ranges. | ||
También puedes establecer `limits` del inglés *límites* en escalas individuales. La reducción de los límites del gráfico es equivalente a seleccionar un subconjunto de los datos. En general es más útil si deseas *expandir* los límites, por ejemplo, cuando quieres hacer coincidir escalas de diferentes gráficos. A modo de ejemplo, si extraemos dos clases de automóviles y los graficamos por separado, son difíciles de comparar ya que las tres escalas (el eje x, el eje y y la estética del color) tienen rangos diferentes. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
son difíciles de comparar > la comparación se hace difícil,
geom_point() | ||
``` | ||
|
||
One way to overcome this problem is to share scales across multiple plots, training the scales with the `limits` of the full data. | ||
Una forma de superar este problema es compartir la escala entre varios gráficos, estableciendo una escala única a partir de los límites del conjunto de datos completo. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Una forma de superar este problema es compartir la escala entre varios gráficos, estableciendo una escala única a partir de los límites del conjunto de datos completo. > Una forma de superar este problema, es compartir la escala entre varios gráficos, estableciendo una escala única a partir de los límites del total de los datos.
geom_point() + | ||
x_scale + | ||
y_scale + | ||
col_scale | ||
``` | ||
En este caso particular podrías haber simplemente empleado la separación en facetas, pero esta técnica es más útil en general, por ejemplo, si deseas realizar gráficos en varias páginas de un informe. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
En este caso particular podrías haber simplemente empleado la separación en facetas, pero esta técnica es más útil en general, por ejemplo, si deseas realizar gráficos en varias páginas de un informe. > En este caso en particular, podrías haber empleado la separación en facetas, no obstante, esta técnica suele es más útil si deseas distribuir los gráficos en varias páginas de un informe.
|
||
```{r themes, echo = FALSE, fig.cap = "The eight themes built-in to ggplot2."} | ||
knitr::include_graphics("images/visualization-themes.png") | ||
``` | ||
Muchas personas se preguntan por qué el tema predeterminado tiene un fondo gris. Esta fue una elección deliberada ya que el fondo gris pone los datos por delante mientras siguen siendo visibles las líneas de la cuadrícula. Las líneas blancas de la cuadrícula son visibles (lo cual es importante porque ayudan significativamente a evaluar la posición), pero tienen poco impacto visual y son fáciles de eliminar. El fondo gris le da a al gráfico un color tipográfico similar al del texto, asegurando que los gráficos encajen con el flujo de un documento sin saltar con un fondo blanco brillante. Finalmente, el fondo gris crea un campo continuo de color que asegura que el gráfico se perciba como una sola entidad visual. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
mientras siguen siendo visibles las líneas de la cuadrícula > mientras las líneas de la cuadrícula siguen siendo visibles
sin saltar > sin resaltar
|
||
Many people wonder why the default theme has a grey background. This was a deliberate choice because it puts the data forward while still making the grid lines visible. The white grid lines are visible (which is important because they significantly aid position judgements), but they have little visual impact and we can easily tune them out. The grey background gives the plot a similar typographic colour to the text, ensuring that the graphics fit in with the flow of a document without jumping out with a bright white background. Finally, the grey background creates a continuous field of colour which ensures that the plot is perceived as a single visual entity. | ||
También es posible controlar componentes individuales de cada tema, como el tamaño y el color de la fuente utilizada para el eje y. Desafortunadamente, este nivel de detalle está fuera del alcance de este libro, por lo que deberás leer el libro [ggplot2 book](https://amzn.com/331924275X) para obtener todos los detalles. También puedes crear tus propios temas, si estás tratando de hacer coincidir un estilo corporativo o de revista en particular. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
También puedes crear tus propios temas, si estás tratando de hacer coincidir un estilo corporativo o de revista en particular. > También puedes crear tus propios temas, en caso que estés tratando de emular un estilo corporativo o de una revista en particular.
ggsave("my-plot.pdf") | ||
``` | ||
```{r, include = FALSE} | ||
file.remove("my-plot.pdf") | ||
``` | ||
|
||
If you don't specify the `width` and `height` they will be taken from the dimensions of the current plotting device. For reproducible code, you'll want to specify them. | ||
Si no especificas `width` y `height`, del inglés el *ancho* y el *alto*, se usarán las dimensiones del dispositivo empleado para graficar. Para que el código sea reproducible, necesitarás especificarlos. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
se usarán las dimensiones del dispositivo empleado para graficar > se usarán las actuales dimensiones del dispositivo empleado para graficar
|
||
Generally, however, I think you should be assembling your final reports using R Markdown, so I want to focus on the important code chunk options that you should know about for graphics. You can learn more about `ggsave()` in the documentation. | ||
En general, sin embargo, creo que deberías armar tus informes finales utilizando R Markdown, por lo que quiero centrarme en las opciones importantes para los bloques de código que debes conocer para graficar. Puedes obtener más información sobre `ggsave()` en la documentación. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
En general, sin embargo, creo que deberías armar tus informes finales utilizando R Markdown, por lo que quiero centrarme en las opciones importantes para los bloques de código que debes conocer para graficar. > No obstante, creo que deberías producir tus informes finales utilizando R Markdown. A continuación, te enseñare las opciones de los bloques de código que son más relevantes al momento de producir gráficos.
|
||
The biggest challenge of graphics in R Markdown is getting your figures the right size and shape. There are five main options that control figure sizing: `fig.width`, `fig.height`, `fig.asp`, `out.width` and `out.height`. Image sizing is challenging because there are two sizes (the size of the figure created by R and the size at which it is inserted in the output document), and multiple ways of specifying the size (i.e., height, width, and aspect ratio: pick two of three). | ||
El mayor desafío de los gráficos en R Markdown es conseguir que tus figuras tengan el tamaño y la forma correctos. Hay cinco opciones principales que controlan el tamaño de la figura: `fig.width`, `fig.height`, `fig.asp`, `out.width` y `out.height`. El tamaño de la imagen es un desafío porque hay dos tamaños (el tamaño de la figura creada por R y el tamaño al que se inserta en el documento de salida) y varias formas de especificarlo (es decir, altura, ancho y relación de aspecto: elige dos de tres). |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
y la forma correctos > y la forma correcta
El tamaño de la imagen es un desafío > conseguir el tamaño de imagen adecuado es un desafío
width. To enforce this, I set `fig.width = 6` (6") and `fig.asp = 0.618` | ||
(the golden ratio) in the defaults. Then in individual chunks, I only | ||
adjust `fig.asp`. | ||
* Encuentro estéticamente más agradable que los gráficos tengan un ancho consistente. Para hacer cumplir esto, configuro `fig.width = 6` (6 ") y `fig.asp = 0.618` (la proporción áurea) en los valores predeterminados. Luego, en bloques individuales, solo ajusto `fig.asp`. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Para hacer cumplir esto > Para lograr esto
width. To enforce this, I set `fig.width = 6` (6") and `fig.asp = 0.618` | ||
(the golden ratio) in the defaults. Then in individual chunks, I only | ||
adjust `fig.asp`. | ||
* Encuentro estéticamente más agradable que los gráficos tengan un ancho consistente. Para hacer cumplir esto, configuro `fig.width = 6` (6 ") y `fig.asp = 0.618` (la proporción áurea) en los valores predeterminados. Luego, en bloques individuales, solo ajusto `fig.asp`. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Luego, en bloques individuales > Luego, en bloques específicos
of the line width). I default to `out.width = "70%"` | ||
and `fig.align = "center"`. That give plots room to breathe, without taking | ||
up too much space. | ||
* Controlo el tamaño de salida con `out.width` y lo configuro a un porcentaje del ancho de línea). De manera predeterminada, `out.width = "70%"` y `fig.align = "center"`. Eso le da a los gráficos cierto espacio para respirar, sin ocupar demasiado espacio. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
De manera predeterminada > Mis opciones predeterminadas son
`fig.align = "default"`. Depending on what I'm trying to illustrate (e.g. | ||
show data or show plot variations), I'll also tweak `fig.width`, as | ||
discussed below. | ||
* Para poner múltiples gráficos en una sola fila, establezco `out.width en 50%` para dos gráficos, `33%` en 3 gráficos, o `25%` en 4 gráficos, y `setfig.align = "default"`. Dependiendo de lo que intento ilustrar (por ejemplo, mostrar datos o variacionesdel gráfico), también modificaré `fig.width` cómo se explica a continuación. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Para poner múltiples gráficos en una sola fila, establezco out.width en 50%
para dos gráficos, 33%
en 3 gráficos, o 25%
en 4 gráficos, y setfig.align = "default"
. Dependiendo de lo que intento ilustrar (por ejemplo, mostrar datos o variacionesdel gráfico), también modificaré fig.width
cómo se explica a continuación.
Para poner múltiples gráficos en una sola fila, dejo
setfig.align = "default"
y establezcoout.width
en50%
para dos gráficos, en33%
para 3 gráficos o en25%
para cuatro. Como se explica a continuación, dependiendo de lo que este intentando de ilustrar (por ejemplo, mostrar datos o variaciones del gráfico), también ajustarefig.width
.
|
||
If you find that you're having to squint to read the text in your plot, you need to tweak `fig.width`. If `fig.width` is larger than the size the figure is rendered in the final doc, the text will be too small; if `fig.width` is smaller, the text will be too big. You'll often need to do a little experimentation to figure out the right ratio between the `fig.width` and the eventual width in your document. To illustrate the principle, the following three plots have `fig.width` of 4, 6, and 8 respectively: | ||
Si observas que tienes que entrecerrar los ojos para leer el texto de tu gráfico, debes ajustar `fig.width`. Si `fig.width` es mayor que el tamaño de la figura en el documento final, el texto será demasiado pequeño; si `fig.width` es más pequeño, el texto será demasiado grande. A menudo necesitarás experimentar un poco para calcular la proporción correcta entre `fig.width` y el ancho asociado en tu documento. Para ilustrar el principio, los siguientes tres gráficos tienen `fig.width` de 4, 6 y 8, respectivamente: |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Si observas que tienes que entrecerrar los ojos para leer el texto de tu gráfico, > Si te das cuenta que debes entrecerrar tus ojos para leer el texto de tu gráfico
y el ancho asociado en tu documento > y el ancho asociado de tu documento
Para ilustrar el principio, > A modo de ilustración
@@ -575,20 +545,21 @@ plot | |||
plot | |||
``` | |||
|
|||
If you want to make sure the font size is consistent across all your figures, whenever you set `out.width`, you'll also need to adjust `fig.width` to maintain the same ratio with your default `out.width`. For example, if your default `fig.width` is 6 and `out.width` is 0.7, when you set `out.width = "50%"` you'll need to set `fig.width` to 4.3 (6 * 0.5 / 0.7). | |||
Si deseas asegurarte que el tamaño de fuente es el mismo en todas tus figuras, al establecer `out.width`, también necesitarás ajustar `fig.width` para mantener la misma proporción en relación al `out.width` predeterminado. Por ejemplo, si tu valor predeterminado de `fig.width` es 6 y `out.width` es 0.7, cuando establezcas `out.width = "50%"` necesitarás establecer `fig.width` a 4.3 (6 * 0.5 / 0.7). |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Si deseas asegurarte que el tamaño de fuente es el mismo en todas tus figuras, al establecer out.width
, también necesitarás ajustar fig.width
para mantener la misma proporción en relación al out.width
predeterminado. > Si deseas que el tamaño de fuente de todas tus figuras sea el mismo, debes asegurarte de ajustar fig.width
cada vez que establezcas out.width
, para así mantener la misma proporción en relación al out.width
predeterminado.
|
||
If you're producing PDF output, the default graphics type is PDF. This is a good default because PDFs are high quality vector graphics. However, they can produce very large and slow plots if you are displaying thousands of points. In that case, set `dev = "png"` to force the use of PNGs. They are slightly lower quality, but will be much more compact. | ||
Es una buena idea darles nombres a los bloques de código que producen figuras, incluso si no etiquetas rutinariamente otros bloques. Etiquetar el bloque se utiliza para generar el nombre de archivo del gráfico en el disco, por lo que darle un nombre a los bloques hace que sea mucho más fácil seleccionar gráficas y reutilizarlas en otras circunstancias (por ejemplo, si deseas colocar rápidamente un solo gráfico en un correo electrónico o un tweet). |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Etiquetar el bloque se utiliza para generar el nombre de archivo del gráfico en el disco > La etiqueta del bloque se utiliza para generar el nombre del archivo del gráfico en el disco
|
||
## Learning more | ||
El mejor lugar para aprender más es el libro de ggplot2: [_ggplot2: Elegant graphics for data analysis_](https://amzn.com/331924275X). Este explica con mucha más profundidad la teoría subyacente y tiene muchos más ejemplos de cómo combinar las piezas individuales para resolver problemas prácticos. Desafortunadamente, el libro no está disponible en línea de forma gratuita, aunque puede encontrar el código fuente en <https://github.com/hadley/ggplot2-book>. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
aunque puede encontrar > aunque puedes encontrar
Como no existe el usted en inglés, supongo queda más acorde con el tono del libro dejarlo más informal.
|
||
1. Make a scatterplot of `hwy` vs `cyl`. | ||
4. Realiza un gráfico de dispersión de las variables `autopista` y `cilindros`. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
La traducción literal podría entenderse como un gráfico para cada variable y no un gráfico donde se contrasten (vs) ambas variables.
Yo sugeriría:
Realiza un ráfico de dispersión de autopista
versus cilindros
|
||
In the plot below, one group of points (highlighted in red) seems to fall outside of the linear trend. These cars have a higher mileage than you might expect. How can you explain these cars? | ||
En el siguiente gráfico, un grupo de puntos resaltados en rojo parece quedar fuera de la tendencia lineal. Estos autos tienen un kilometraje mayor de lo que esperaríamos. ¿Cómo puedes explicar estos autos? |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Mantendría el texto más cercano al original y reemplazaría el término auto por vehículos:
En el siguiente gráfico, un grupo de puntos (resaltados en rojo) parece quedar fuera de la tendencia lineal. Estos vehículos tienen un kilometraje mayor de lo que esperaríamos. ¿Cómo puedes explicar estos vehículos?
Traducción mpaulacaldas (Related #24)
Maria Florencia D'Andrea y Maria Paula Caldas