From fccd6c0a3f824dd652700078a7c70cbe6baba074 Mon Sep 17 00:00:00 2001 From: Andrey Nogueira Menezes Date: Wed, 27 Feb 2013 15:07:35 -0300 Subject: [PATCH] US10 --- US10 - Analise Tendencia A Grupos.R | 50 +++++++++++++++++++ "US2 - Automatiza\303\247\303\243o.R" | 8 +-- ...- Analise NumeroSubmiss\303\265es-Tempo.R" | 6 +-- 3 files changed, 57 insertions(+), 7 deletions(-) create mode 100644 US10 - Analise Tendencia A Grupos.R diff --git a/US10 - Analise Tendencia A Grupos.R b/US10 - Analise Tendencia A Grupos.R new file mode 100644 index 0000000..f518188 --- /dev/null +++ b/US10 - Analise Tendencia A Grupos.R @@ -0,0 +1,50 @@ +# Codigo que cria as tabelas dos agrupamentos dos dados +# Andrey Menezes - versão 2.0 (Fevereiro 2013) + +library("FNN") + +hopkins = function(dados, p, objetos, minimos) { + + amostra = sample(length(dados[,1]), size=p, replace = FALSE) + + soma_w = 0 + for(i in 1:length(amostra)) { + soma_w = soma_w + minimos[i] + } + + soma_u = 0 + for(i in 1:length(objetos[,1])) { + dist = knnx.dist(as.matrix(dados),as.matrix(objetos),2,"kd_tree") + soma_u = sum(dist[,2]) + } + if(soma_u > 0) { + return(soma_u/(soma_u + soma_w)) + } else {return(0)} +} + +hopkins.table = data.frame() + +minimo = knn.dist(dados, k=1, algorithm="kd_tree") +stats = 0 + +col=0 +for(n in 1:10) { + count=0 + col=col+1 + for(i in 2:(length(dados)-1)) { + for(e in (i+1):length(dados)) { + if(i != e) { + objetos = data.frame(runif(60, min(dados[,i]), max(dados[,i])), runif(60, min(dados[,e]), max(dados[,e]))) + parcial = hopkins(dados[,c(i,e)], 60, objetos, minimo) + if (parcial > stats) { + stats = parcial + atrib1 = i + atrib2 = e + } + count = count+1 + hopkins.table[col,count] = parcial + } + } + } +} +colnames(hopkins.table) = c("A_Q", "A_C", "A_TA", "A_AS", "A_QS", "A_CS", "Q_C", "Q_TA", "Q_AS", "Q_QS", "Q_CS", "C_TA", "C_AS", "C_QS", "C_CS", "TA_AS", "TA_QS", "TA_CS", "AS_QS", "AS_CS", "QS_CS") diff --git "a/US2 - Automatiza\303\247\303\243o.R" "b/US2 - Automatiza\303\247\303\243o.R" index 3eefa86..9583a9d 100644 --- "a/US2 - Automatiza\303\247\303\243o.R" +++ "b/US2 - Automatiza\303\247\303\243o.R" @@ -1,5 +1,5 @@ # Codigo que cria as tabelas dos agrupamentos dos dados -# Andrey Menezes - vers�o 2.0 (Fevereiro 2013) +# Andrey Menezes - versão 2.0 (Fevereiro 2013) #dados usados data_exerc = read.csv("../dados/exercicios-20112.csv") @@ -9,11 +9,11 @@ prova.um = read.csv("../dados/Prova1.csv") prova.dois = read.csv("../dados/Prova2.csv") prova.tres = read.csv("../dados/Prova3.csv") -#Script de automatiza��o UC3 e UC4 +#Script de automatiza??o UC3 e UC4 source("../Processamento/processamento.R") -#Script de automatiza��o UC1 +#Script de automatiza??o UC1 source("../Processamento/UC1-A Priori.R") -#Script de automatiza��o UC2 +#Script de automatiza??o UC2 source("../Processamento/UC2.R") \ No newline at end of file diff --git "a/US7 - Analise NumeroSubmiss\303\265es-Tempo.R" "b/US7 - Analise NumeroSubmiss\303\265es-Tempo.R" index ce1b400..69a81c8 100644 --- "a/US7 - Analise NumeroSubmiss\303\265es-Tempo.R" +++ "b/US7 - Analise NumeroSubmiss\303\265es-Tempo.R" @@ -1,5 +1,5 @@ -# Codigo para analise de n�mero de submiss�es pelo tempo -# Andrey Menezes - vers�o 2.0 (Fevereiro 2013) +# Codigo para analise de número de submissões pelo tempo +# Andrey Menezes - versão 2.0 (Fevereiro 2013) library(plyr) @@ -11,4 +11,4 @@ colnames(dados) = c("matricula","data") submission = count(dados, "data") a = qplot(submission$data, submission$freq, geom="histogram", xlab="Tempo", ylab="Numero de submissoes") -a + geom_vline(xintercept = "9/26/2011", colour="green", linetype = "longdash") \ No newline at end of file +a + geom_vline(xintercept = "9/26/2011", colour="green", linetype = "longdash")