-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathExerciciosJornadas.Rmd
140 lines (87 loc) · 2.29 KB
/
ExerciciosJornadas.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
---
title: "Exercícios Jornadas NMath"
author: "R-Ladies Lisboa"
date: "7 de Abril de 2017"
output:
pdf_document: default
html_document: default
---
**Carregar Dados**
```{r}
#Package 'ggplot2' para elaborar os gráficos
install.packages("ggplot2")
library(ggplot2)
#Dataset 'diamonds'
help(diamonds)
```
**O que podemos descobrir pela análise dos dados...**
- Quantas observaçõeses há no dataset diamonds?
- Quantas variáveis há no dataset diamonds?
- Quantos ordered factors há no dataset?
- Que cor de diamante tem mais valor de mercado?
```{r}
#use head, str and/or summary
```
**Tarefa 1** - Crie um histograma de preços de diamantes do dataset diamonds, especificando o "geom".
A distribuição tem uma cauda comprida?
```{r}
ggplot()
```
**Tarefa 2** - Qual a Média e a Mediana da distribuição de preços de diamantes.
```{r}
```
**Tarefa 3**
- Quantos diamantes custam menos de $500?
```{r}
```
- Quantos diamantes custam menos de $250?
```{r}
```
- Quantos diamantes custam $15000 ou mais?
```{r}
```
**Tarefa 4** - Voltando ao histograma anterior, tente limitar o eixo dos xx e ajustar a binwidth.
```{r}
```
**Tarefa 5** - Use o comando facet_wrap(~variável) e desdobre o gráfico anterior segundo o corte.
```{r}
```
**Tarefa 6** - Investigue o preço dos diamantes usando boxplots e a variável categórica: 'cut'.
Vê algo de estranho? O quê?
```{r}
```
```{r}
#Avaliar a importância do corte para o preço final do diamante
by()
```
```{r}
#Avaliar a importância do corte para o preço final do diamante, mas introduzindo a variável 'carat' - y=price/carat
ggplot()
```
```{r}
by()
```
```{r}
#Avaliar agora apenas a importância do 'carat' para o preço final do diamante
ggplot()
```
```{r}
#Introduzir as variáveis a avaliar: 'price' e 'carat'
cor.test(method="pearson")
```
**Tarefa 7** - Crie um scatter plot de preço em função da variável x.
'x','y' e 'z' são respectivamente a altura, largura e profundidade de um diamante em mm.
Há outliers? Que tipo de relação existe entre x e preço?
```{r}
names(diamonds)
summary(diamonds$x)
```
```{r}
```
Qual a correlação entre x e preço?
```{r}
```
**Tarefa 8** - Crie um histograma de preços.
Desdobre o histograma por cores e use a variável 'cut' para colorir os histogramas.
```{r}
```