Gabriel Ferreira seminário 26/10
Colocar fotos de louça.
Discussão do Exemplo de Salários
Sequência para Tomada de Decisão
Utilizando Inferência Estatística (Margem de Erro e Margem de Confiança)
· Passo I – Formular a Hipótese de Nulidade ou de Igualdade:
o Ho: S_SP = S_RJ = S_MS
· Passo II – Formular a Hipótese Alternativa:
o H1: Existe Alguma Diferença
· Passo III – Definir a Margem de Erro ou Significância Critica = 0,05 = 5% ou Margem de Confiança = 95%
· Passo IV – Escolher a Estatística Adequada:
o F de Fisher e Snedecor
o Teste de Comparações Múltiplas de Tukey
· Passo V – Verificar Resultado Probabilístico da Aplicação dos Testes:
o Margem de Erro do Teste F= 0,0125
§ Como Margem de Erro < 0,05 então rejeita-se a Ho
o Onde estão as diferenças:
§ Aplicação do Teste de Tukey
· Passo VI – Tomar a Decisão:
o Instalaremos nossa fábrica em MS por que é menor o custo de Mao de Obra, operacional qualificada (supervisor), depois de analisar também custos de outras categorias de mão de obra, logística, impostos, etc.
data salarios;
input No_Cidade Estado $ Salario;
cards;
17 RJ 1870
16 RJ 2030
8 SP 1800
11 MS 1700
6 SP 2150
19 RJ 1910
10 MS 1890
18 RJ 2200
14 SP 2180
4 MS 1890
3 MS 1650
20 RJ 1890
12 MS 1950
7 SP 2320
15 RJ 1990
2 SP 1850
1 MS 1678
9 MS 1789
5 SP 1950
13 SP 2150
;
proc anova;
class Estado;
model Salario = Estado;
means Estado / Tukey lines;
run;
The ANOVA Procedure
Class Level Information
| ||
Class
|
Levels
|
Values
|
Estado
|
3
|
MS RJ SP
|
Number of Observations Read
|
20
|
Number of Observations Used
|
20
|
The ANOVA Procedure
Dependent Variable: Salario
Source
|
DF
|
Sum of Squares
|
Mean Square
|
F Value
|
Pr > F
|
Model
|
2
|
258846.6452
|
129423.3226
|
5.73
|
0.0125
|
Error
|
17
|
383829.9048
|
22578.2297
| ||
Corrected Total
|
19
|
642676.5500
|
Margem de Confiança Percentual =
(1- 0,0125) * 100 = 0,9875 * 100 = 98,7 % (valor critico é 95%)
Com essa confiança rejeita-se a hipótese de igualdade de salários nos estados.
Assim existe alguma diferença entre os estados.
Para pesquisar entre quais estados existe diferença entre os salários, vamos aplicar o Teste de Comparações Múltiplas de Tukey.
R-Square
|
Coeff Var
|
Root MSE
|
Salario Mean
|
0.402763
|
7.738010
|
150.2605
|
1941.850
|
Source
|
DF
|
Anova SS
|
Mean Square
|
F Value
|
Pr > F
|
Estado
|
2
|
258846.6452
|
129423.3226
|
5.73
|
0.0125
|
The ANOVA Procedure
The ANOVA Procedure
Tukey's Studentized Range (HSD) Test for Salario
Note:
|
This test controls the Type I experimentwise error rate, but it generally has a higher Type II error rate than REGWQ.
|
Alpha
|
0.05
|
Error Degrees of Freedom
|
17
|
Error Mean Square
|
22578.23
|
Critical Value of Studentized Range
|
3.62796
|
Minimum Significant Difference
|
211.69
|
Harmonic Mean of Cell Sizes
|
6.631579
|
Note:
|
Cell sizes are not equal.
|
Means with the same letter
are not significantly different. | ||||
Tukey Grouping
|
Mean
|
N
|
Estado
| |
A
|
2057.14
|
7
|
SP
| |
A
| ||||
B
|
A
|
1981.67
|
6
|
RJ
|
B
| ||||
B
|
1792.43
|
7
|
MS
|
Logica de Aristóteles:
1) A = A;
2) A ≠ Não (A);
3) Se A=B e B=C então A=C;
ANOVA dados brutos - Kruskal-Wallis
Rodar MANOVA dos Dados do Exemplo Anterior (aula passada)
Programa para Rodar MANOVA:
SAS Students Remoto Servidor LCE:
143.107.212.50:10080
data imc_dat;
input cat $ imc corr kcal;
cards;
AT 20.2 60.7 3200
AT 21.3 54.8 3100
AT 19.3 49.6 2800
AT 21.1 52.3 3300
SEM 22.4 14.9 2600
SEM 21.9 17.8 2700
SEM 23.8 18.6 3200
SEM 24.1 15.1 3300
SE 27.3 2.5 2700
SE 23.4 4.3 2300
SE 25.2 2.3 2600
SE 26.4 2.6 3200
PR 26.2 4.1 2600
PR 24.2 2.1 2700
PR 25.4 1.9 2650
;
proc print;
run;
/*
/*
proc glm;
class cat;
model imc corr kcal = cat;
contrast " Atl e Semiat Vs Seden e Prof" cat 1 1 -1 -1;
manova h=_all_ / printe printh;
run;
/* Se tirar o comando manova faz os contrastes univariados
contrast " Se Vs Prof " cat 0 0 1 -1;
Resultado do Programa de MANOVA:
Arquivo para Download (mht abrir no Wodr)
Arquivo Word de Resultados
- Análise Multivariada Exemplos:
Comparar resultados ANOVA com Kruskal-Wallis.
Criar programa de KruskalWallis para os dados da Manova com base nos Slides a Seguir
data imc_dat;
input cat $ imc corr kcal;
cards;
AT 20.2 60.7 3200
AT 21.3 54.8 3100
AT 19.3 49.6 2800
AT 21.1 52.3 3300
SEM 22.4 14.9 2600
SEM 21.9 17.8 2700
SEM 23.8 18.6 3200
SEM 24.1 15.1 3300
SE 27.3 2.5 2700
SE 23.4 4.3 2300
SE 25.2 2.3 2600
SE 26.4 2.6 3200
PR 26.2 4.1 2600
PR 24.2 2.1 2700
PR 25.4 1.9 2650
;
proc print;
run;
proc npar1way data=imc_dat wilcoxon dscf;
class cat;
var imc corr kcal = cat;
run;
var imc corr kcal = cat; ==> ANOVA, GLM, MANOVA
Tem um erro nesse programa, onde esta? Compare com os slides apresentados antes do programa SAS (Dois slides de Kruskal Wallis com trechos de programa SAS).
var imc corr kcal; ==> Kruskal Wallis
Resultados de Kruskal Wallis
Resultados ANOVA dados brutos, transformados e da Estat. Robusta. Tese doutorado do Gabriel.