Introdução às Ferramentas de Análise Estatística do Excel 2007

Transcription

Introdução às Ferramentas de Análise Estatística do Excel 2007
UFMS - Universidade Federal de Mato Grosso do Sul
CCET - Centro de Ciências Exatas e Tecnologia
DEC - Departamento de Estruturas e Construção Civil
Disciplina: Avaliações e Perícias na Construção Civil
Professor Wagner Augusto Andreasi, M. Engº
Acadêmico do Curso de Engª. Cvil: Ademir Aparecido Peixoto de Azevedo
Atualizada pelo Acadêmico do Curso de Engª. Cvil Thiago Winter Macinelli em 2009
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
SUMÁRIO
1. Introdução......................................................................................................................3
2. Regressão Linear simples..............................................................................................3
2.1.
Calculo das estatísticas de regressão e ANOVA..........................................3
2.2.
Determinação do intervalo de confiança......................................................9
2.3.
Teste de hipóteses........................................................................................11
2.4.
Verificação das hipóteses básicas...............................................................13
3. Regressão Linear Múltipla..........................................................................................16
3.1.
Considerações preliminares........................................................................16
3.2.
Verificação da colinearidade entre variáveis independentes.....................18
3.3.
Calculo das Estatísticas de Regressão e Anova..........................................21
3.4.
Determinação do Intervalo de Confiança...................................................25
3.5.
Teste de hipóteses........................................................................................27
3.6.
Verificação das hipóteses básicas...............................................................28
4. Exemplos Resolvidos....................................................................................................28
5. Referências Bibliográficas...........................................................................................53
6. Anexo 1( Tabela de Durbin-Watson)..........................................................................54
2
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
1. Introdução
Esta apostila tem o objetivo de apresentar ao leitor as ferramentas de Análise Estatística
disponíveis no Microsoft Excel 2007 aplicadas a Engenharia de Avaliações, utilizando-as em
exemplos de resolução de problemas de regressão linear simples e regressão linear múltipla.
Pressupõe-se nesta apostila que o leitor já tenha conhecimentos teóricos básicos de
estatística, tais como distribuições bilaterais e unilaterais, colinearidade, análise de resíduos,
testes de significância, análise de variância e regressão linear. O objetivo maior desta apostila é
diminuir o esforço e o tempo necessário para realizar uma avaliação utilizando o Microsoft Excel
para realizar os cálculos, que são muito complexos e longos para serem feitos “a mão”.
2. Regressão Linear Simples
2.1.
Calculo das Estatísticas de Regressão e Anova
Consideremos o exemplo onde estamos interessados em avaliar um lote de 300 m 2 de
área, situado a uma distância de cerca de 2.100 m de um ponto valorizante. Os atributos de
diferenciação levantados compreendem a localização do lote, através da distância do mesmo em
metros ao referido ponto e a área do lote. As características do imóvel avaliando bem como a dos
imóveis da amostra estão apresentados na tabela abaixo:
REGISTRO
N.º
1
2
3
4
5
6
7
8
9
10
VARIÁVEL
DEPENDENTE
PREÇO UNITÁRIO
(Y)
100,00
110,00
120,00
140,00
85,00
105,00
120,00
95,00
150,00
100,00
VARIÁVEIS INDEPENDENTES
OU EXPLICATIVAS
DIST. (X1)
ÁREA (X2)
2.200,00
2.000,00
1.800,00
1.500,00
2.300,00
1.900,00
1.300,00
2.200,00
900,00
1.700,00
300,00
340,00
270,00
360,00
400,00
500,00
600,00
300,00
360,00
600,00
Tabela 1.1
Inicialmente poderíamos supor que o atributo distância ao ponto valorizante não seja
influenciante no valor do lote e que a influência da área seja diretamente proporcional a esse
valor, o que possibilitaria a resolução do problema por estatística descritiva.
Entretanto, procuraremos levar em consideração o atributo distância ao ponto valorizante na
formação dos preços, obtendo uma equação de regressão linear simples, relacionando o preço
unitário (PU) com a distância (DIST) do tipo: Ŷi = B0 + B1X1, que terá o seguinte aspecto:
3
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
PÛ= B0+ B1 * DIST
Para tanto, utilizaremos o Excel 2007 e o suplemento PHStat2 para calcular as Estatísticas de
Regressão, Anova e Correlação. Ative o Excel e insira os dados em sua área de trabalho
(Tabela 1.1), como mostrado na Figura 1.1.
Figura 1.1
Antes de iniciar a Análise de Dados é necessário ativar os suplementos do Excel 2007 para que as
ferramentas de análise estejam disponíveis, para ativá-las, clique com o botão direito sobre a
barra de ferramentas, em seguida clique em “Personalizar barra de tarefas de acesso rápido” ,
clique em “Suplementos”, na opção Gerenciar, selecione a opção “Suplementos do Excel” e
em seguida clique em “IR”, no menu suplementos ative os itens “Ferramentas de Análise” e
“Ferramentas de Análise – VBA” , como mostrado na Figura 1.2, em seguida clique em
“OK”.
4
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Figura 1.2
No menu Dados clique em “Análise de Dados”.
Na caixa de diálogo Análise de Dados dê um duplo clique em “Regressão”. (Figura 1.3)
Figura 1.3
5
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
No campo Intervalo Y de Entrada deve ser fornecido o intervalo que contém as variáveis
dependentes ou explicadas, que em nosso caso é PU. Selecione a célula B1 e arraste até a célula
B11. Clique no campo Intervalo X de Entrada.
Da mesma forma, para este campo, deve ser fornecido o intervalo que contém as variáveis
independentes ou explicativas, que em nosso caso é a distância. Portanto, selecione a célula C1 e
arraste até a célula C11 para selecionar o intervalo. Marque a opção Rótulos, pois em nossos
intervalos incluímos junto aos dados seus respectivos rótulos.
Marque a opção Nível de Confiança e substitua o valor padrão de 95% por 80% que é o valor
recomendado pela NBR-14653-2:2003.
Marque as opções “Resíduos”, “Resíduos Padronizados” e “Plotar Resíduos”.
Figura 1.4
Clique
no botão Intervalo de saída e, posteriormente, no campo que está a sua direita. Insira a
referência para a célula onde o Microsoft Excel exibirá o canto superior esquerdo da tabela de
regressão e Anova.
Para tanto, após selecionar o referido campo clique sobre a célula A19 ou referencie a célula A19
digitando “A19” diretamente no campo.
A aparência da caixa de diálogo Regressão ficará semelhante com a da Figura 1.4 mostrada
acima. Clique em OK.
6
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
O Excel fornecerá as Estatísticas de Regressão, Anova e Tabela de Resíduos.
Figura 1.5
Registro nº Variável Dependente (PU)
1
100,00
2
110,00
3
120,00
4
140,00
5
85,00
6
105,00
7
120,00
8
95,00
9
150,00
10
100,00
DIST. (X1)
2.200,00
2.000,00
1.800,00
1.500,00
2.300,00
1.900,00
1.300,00
2.200,00
900,00
1.700,00
ÁREA (X2)
300
340
270
360
400
500
600
300
360
600
Tabela 1.2
Antes de fazer a inferência estatística é necessário conhecer o significado dos parâmetros
fornecido pelo Excel:
7
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo
0,88054
R-Quadrado
0,77536
R-quadrado
ajustado
0,74728
Erro padrão
10,21017
Observações
10
Tabela 1.3
R-múltiplo: Correlação entre as variáveis independentes e a variável dependente.
R-quadrado: Poder de explicação do modelo de regressão, no exemplo 77,5% da variabilidade
dos preços é explicado pelo modelo adotado
R-quadrado ajustado: Idem ao R-quadrado, porém ajustado levanto em conta o numero de
variáveis independentes
Erro padrão: É o desvio padrão do modelo, dado pela raiz quadrada da variância.
ANOVA
gl
Regressão
Resíduo
Total
1
8
9
SQ
2878,51914
833,98085
3712,5
Interseção
DIST. (X1)
Coeficientes
184,16104
-0,040259
Erro padrão
14,01440
0,00766
Inferior
80,0%
MQ
F
2878,51914 27,61233
104,24760
F de
significação
0,00077
Stat t
valor-P 95% inferiores
13,14084 1,07E-06
151,84380
-5,25474 0,00077
-0,05793
95%
superiores
216,47830
-0,02259
Superior
80,0%
164,58550 203,73660
-0,05096 -0,02956
Tabela 1.4
8
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
RESULTADOS DE RESÍDUOS
Observação
1
2
3
4
5
6
7
8
9
10
Previsto(a) PREÇO UNITÁRIO
(Y)
95,59121
103,64301
111,69481
123,77252
91,56531
107,66891
131,82432
95,59121
147,92792
115,72072
Resíduos
4,40878
6,35698
8,30518
16,22747
-6,56531
-2,66891
-11,82432
-0,59121
2,07207
-15,72072
Resíduos padrão
0,45799
0,66038
0,86276
1,68575
-0,68202
-0,27725
-1,22834
-0,06141
0,21525
-1,63311
Tabela 1.5
Agora de posse dos coeficientes da equação de regressão linear simples, podemos concluir que a
equação PÛ = B0 + B1 * DIST, fazendo as devidas substituições com os coeficientes, é:
PÛ = 184,161 – 0,04026*DIST,
Que para DIST = 2.100 m resulta:
PÛ = R$ 99,62 / m2
2.2.
Determinação do Intervalo de Confiança:
Para o cálculo do Intevalo de confiança utilizaremos o “PHStat2”. O software será
disponibilizado pelo professor no inicio do curso, ou pode-se fazer o download a partir do site
http://www.dec.ufms.br/lade. ALTERAR
Após instalado o “PHStat” só estará disponível no Excel quando ele for aberto, portanto, toda
vez que forem utilizar o “PHStat” deve-se abrir o “Excel” e o “PHStat”. O leitor saberá se o
software esta disponivel verficando se esta aparecendo o menu “Suplementos” na barra de
ferramentas. No caso de o menu “Suplementos” não estar aparecendo, a instalação pode ter
sido feita de forma incorreta, ou o usuário não abriu o “PHStat”
Na barra de ferramentas abra o menu “Suplementos”, clique em “PHStat”, clique em
“Regression” e clique em “Simple Linear Regression”
Configure o PHStat conforme mostrado na figura 1.6, onde X é o valor da variável independente
para o terreno que esta sendo avaliado, no caso X é a distancia 2100 metros. Clique em OK, o
PHStat criará um nova planilha com nome “Estimated” com os intervalos de confiança para o
preço previsto e para uma nova observação.
9
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Fig 1.6
For Average Predicted Y (YHat)
Interval Half Width
5,662778
Confidence Interval Lower Limit 93,95434
Confidence Interval Upper Limit 105,2799
For Individual Response Y
Interval Half Width
15,34483
Prediction Interval Lower Limit
84,27229
Prediction Interval Upper Limit
114,9619
Tabela 1.6
Intervalo de confiança para o valor previsto:
R$ 93,954 < PÛ < R$ 105,279
A NBR 14653-2:2003 sugere a classificação da avaliação quanto ao Grau de Precisão (item
9.2.2). O nível de precisão é encontrado através do valor em porcentagem da amplitude do
10
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
intervalo de confiança de 80% sobre o valor pontual da avaliação. Como fornecemos para o
campo “confidence levels for interval estimates” o valor de 80%, os valor superior e inferior
fornecidos pelo PHStat referem-se a um intervalo de confiança de 80% sobre o valor pontual da
avaliação, com estes dados pode-se calcular a amplitude que é dada por:
AMPLITUDE 
PÛ sup  PÛ inf
PÛ

105,279  93,954
 0,114  11,4%
99,62
III
Grau
II
I
≤ 30%
30% - 50%
> 50%
Descrição
Amplitude do intervalo de confiança de 80%
em torno do valor central da estimativa
NOTA Observar subseção 9.1.
Tabela 1.7
Através da Tabela 1.7, que foi transcrita da NBR 14653-2, pode-se classificar a avaliação quanto
ao grau de precisão, como a amplitude do intervalo de confiança é menor do que 30% , a
avaliação apresenta Grau de Precisão 3
O intervalo para uma resposta individual de Y, é o intervalo de confiança para uma nova
observação que possua as mesmas caracteristicas quanto as variáveis da observação
utilizada para o cálculo, não é de interesse para a avaliação pois o que nos interessa é o
intervalo de confiança para a observação que foi avaliada.
2.3.
Teste de hipóteses
Testada a hipótese nula da regressão (ß1 = 0) pelo teste F, a mesma foi rejeitada ao nível de
1%, uma vez que:
Fcalculado = 27,61 > F (λ) (k), (n-k-1) = F (1%) (1), (8) = 11,30.
(Fcalculado está localizado na célula E30 da tabela do Excel).
Nota: Para obter F (1%) (1), (8) pode-se consultar uma tabela F ou através da função “INVF” do
Excel, para a obtenção através da função “INVF” deve-se proceder da seguinte forma:
Escolha uma célula vazia do Excel e digite a expressão a seguir:
=INVF(“prob”; “k”; “n-k-1”) , onde:
-“prob”: é o nível de significância desejado, em nosso caso 1%
-“k”: é o numero de variáveis do modelo, em nosso caso é 1
-“n” é o numero de amostras do modelo, em nosso caso é 10
11
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Substituindo os dados, a fórmula ficará como a mostrada a seguir:
=INVF(0,01;1;8)
Pressione ENTER, e o Excel fornecerá o valor de F (1%) (1), (8)
Na célula E31 o Excel fornece o F de significação, que é o nível de significância com o qual se
aceita a hipótese nula da regressão, no modelo como F de significação < 0,01, rejeita-se a
hipótese nula da regressão ao nível de 1%.
Testada a hipótese nula do regressor (ß1 =0), a mesma foi rejeitada ao nível de 5%, uma vez
que:
t1 
B1  0,04026

 5,25  t ( n2),   t (8), 5%  2,31
S B1 0,007661
Nota: Para obter t(8), 5% pode-se consultar uma tabela t ou através da função “INVT” do Excel,
para a obtenção através da função “INVT” deve-se proceder da seguinte forma:
Escolha uma célula vazia do Excel e digite a expressão a seguir:
=INVT(“prob”; “n-k-1”) , onde:
-“prob”: é o nível de significância desejado, em nosso caso 5%
-“k”: é o numero de variáveis do modelo, em nosso caso é 1
-“n” é o numero de amostras do modelo, em nosso caso é 10
Substituindo os dados, a fórmula ficará como a mostrada a seguir:
=INVT(0,05;8)
Pressione ENTER, e o Excel fornecerá o valor de t(8), 5%
Outra forma de fazer o teste é através do valor P (Célula E36) que representa o nível de
significância com a qual se aceita a hipótese nula do regressor, no modelo, como valor P < 0,05,
rejeita-se a hipótese nula do regressor ao nível de 5%.
Obs.: Os níveis de significância adotados para o teste de hipóteses devem ser escolhidos
através da NBR 14653, item 9.2.1. Os níveis de significância dependem do Grau de
Fundamentação escolhido pelo avaliador.
2.4.
Verificação das hipóteses básicas
12
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Primeira hipótese: A variável independente corresponde a números reais que não contenham
nenhuma perturbação aleatória.
De fato, no caso de dados imobiliários, as variáveis independentes estão relacionados com as
características fixas de cada elemento tomado com referência, estando a hipótese atendida.
Segunda hipótese: O número de observações, n, deve ser superior ao número de parâmetros
estimados pelo modelo.
Para evitar o problema de micro numerosidade, a NBR 14653-2 no item 3 da Tabela 1 determina
o número mínimo dados de mercado utilizados na modelagem, a princípio:
n  3(k  1) , onde k é o numero de variáveis independentes.
Terceira hipótese: Os erros são variáveis aleatórias com valor esperado nulo e variância
constante.
Um gráfico de resíduos versus valores previsto, apresentando pontos distribuídos aleatoriamente
em torno de uma reta que passa na origem sem nenhum padrão definido, é um indicador
favorável a verificação da hipótese.
Construa um gráfico com os “valores previstos” (Células B43:B52) da tabela de resíduos no
eixo das abscissas e com os “resíduos” (Células C43:C52) no eixo das ordenadas
O gráfico deverá ficar igual ao apresentado abaixo:
Gráfico 1.1
13
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Como os pontos estão distribuídos de forma aleatória em torno da reta horizontal que passa pela
origem e não apresentam nenhum padrão definido, aceita-se a hipótese como atendida, classificase também o modelo como homocedástico1.
Quarta hipótese: Os erros são variáveis aleatórias com distribuição normal.
Um gráfico de resíduos padronizados versus preço previsto, apresentando 95% dos pontos no
intervalo [-1,96;+1,96] é um indicador favorável a verificação da hipótese.
Construa um gráfico com os “valores previstos” (Células B43:B52) da tabela de resíduos no
eixo das abscissas e “resíduos padronizados” (Células D43:D52) no eixo das ordenadas.
O gráfico deverá ficar igual ao apresentado abaixo:
Tabela 1.2
Como 100% dos pontos estão distribuídos no intervalo [-1,96;+1,96] se aceita a quarta hipótese.
Quinta hipótese: Os erros são “não correlacionados”, isto é, são independentes sob a condição
de normalidade.
A verificação é feita com o auxilio da razão de Von Neumann, que foi tabelada por Durbin
Watson para os níveis de significância de 5%, 2,5% e 1%, considerando modelos com 15 a 100
observações com até seis variáveis (Ver Anexo 1).
A estatística de Von Neumann pode ser calculada através do PHStat.. Na barra de ferramentas
abra o menu “Suplementos”, clique em “PHStat”, clique em “Regression” e clique em
“Simple Linear Regression”. Informe o intervalo de células das variáveis dependentes e
independentes, e selecione a opção “Durbin-Watson Statistic”, em seguida clique em “OK”, o
1
Homocedástico: Quando os pontos apresentam dispersão totalmente aleatória em torno de uma reta horizontal que
passa pela origem e sem nenhum padrão definido.
14
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
menu deverá ficar como o apresentado na Figura 1.7. O PHStat criará uma nova planilha com o
valor da Razão de Von Neumann (Durbin-Watson Statistic).
Figura 1.7
Durbin-Watson Calculations
Sum of Squared Difference of
Residuals
Sum of Squared Residuals
1138,727801
833,9808559
Durbin-Watson Statistic
1,365412399
Tabela 1.8
Para que a quinta hipótese seja satisfeita: du < Durbin-Watson Statistic < (4 - du), onde du é o
valor tabelado por Durbin-Watson (ver Anexo 1) . Escolhe-se o valor de du para 15 observações
(du não foi tabelado para 10 observações) e 1 variável independente ao nível de significância de
1%.
dutab  1,07
15
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Como:
1,07 < Durbin-Watson Statistic < (4 -1,07)
1,07 < 1,37 < 2,93
Aceita-se a quinta hipótese.
Desta forma podemos concluir que a equação encontrada para a regressão
PÛ = 184,161 – 0,04026*DIST, é válida para inferência do valor do preço unitário, quando a
distância do terreno ao ponto valorizante for igual a 2100 m.
Obs. Neste exemplo assim como no seguinte, estamos supondo a amostra já saneada, isto é,
isenta de dados supostamente discrepantes. Mais tarde será ilustrado como proceder para sanear
uma amostra utilizando o critério de Chauvenet.
3. Regressão Linear Múltipla
3.1.
Considerações preliminares
É recomendado ao leitor que só inicie a leitura deste capitulo após ter lido o capitulo que trata de
regressão linear simples, pois é necessário o total conhecimento de regressão linear simples para
proceder a analise de regressão múltipla.
Para aplicação da metodologia, será apresentada a avaliação do valor de aluguel de um
apartamento, no exemplo foram escolhidas varias variáveis independentes e o objetivo é
selecionar quais variáveis explicam melhor a variação do valor de mercado do aluguel do imóvel.
Os atributos de diferenciação levantados compreendem:
-Variáveis quantitativas
- Número de quartos
- Número de banheiros
- Número de vagas de garagem.
Variáveis dicotômicas:
-Área de lazer (Recebe valor 1 se o apartamento possuir, e 0 em caso contrário)
Variáveis qualitativas:
-Estado de conservação (Recebe valor 1 para bom, 2 para regular e 3 para ruim), é
considerada como qualitativa, mas na verdade é uma variável tricotômica.
É de grande importância o avaliador verificar após a regressão se os coeficientes
encontrados para cada variável condiz com a realidade conforme o exemplo:
Ex: O coeficiente de uma variável com valor da área não pode ser negativo, pois sabe-se que
quanto maior a área do imóvel maior seu valor.
O imóvel avaliando possui as seguintes características:
- Numero de quartos: 3
16
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
-Numero de banheiros: 2
- Numero de vagas de garagem: 1
-Área de lazer: Não possui (Recebe valor 0)
-Estado de conservação: Regular (Recebe valor 2)
Desta forma, tentar-se-á obter uma equação de regressão múltipla relacionando o preço unitário
(PU) com as variáveis descritas anteriormente. A equação será do tipo:
PUi = Bo + B1X1 + B2X2 + ....+ BnXn
Os dados coletados do mercado para a avaliação são os descritos na tabela abaixo:
N. de
registro
Preço
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
450
400
500
500
350
600
350
300
450
350
500
500
500
350
400
300
500
450
400
480
420
Numero de Número de
quartos
banheiros
(X1)
(X2)
3
3
3
3
2
3
2
2
2
2
3
3
3
2
2
2
3
2
2
3
3
2
1
2
2
1
2
1
1
1
1
2
2
2
1
1
1
2
1
1
2
2
Vagas de
garagem
(X3)
1
1
1
2
1
2
1
1
1
1
1
1
2
1
1
1
1
1
1
1
1
Estado de
Área de
conservação
lazer (X5)
(X4)
2
3
2
3
2
1
2
2
1
2
2
2
2
2
2
2
2
1
2
3
3
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
0
Tabela 2.1
Na regressão múltipla deve-se atentar a correlação entre variáveis independentes, que se for alta
pode prejudicar a estimativa dos parâmetros do modelo, gerando um modelo tendencioso que não
explica de fato o comportamento dos valores de mercado.
17
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
3.2.
Verificação da colinearidade entre variáveis independentes
Inicialmente será verificado a correlação entre as variáveis utilizando a tabela de correlação
do Excel e o fator inflacionário de variância (FIV) obtido através do PHStat. A tabela de
correlação fornece a correlação das variáveis uma a uma, enquanto o FIV fornece a correlação de
uma variável com todas as outras variáveis do modelo.
O FIV é dado por:
1
, onde:
FIV 
2
1  rj
r j - Correlação entre uma variável independente com as variáveis independentes restantes.
Portanto quando r j =0,9, o FIV é aproximadamente 5. Alguns autores consideram como valor
critico para o FIV o valor 5, outros consideram crítico o valor 10, nesta apostila consideraremos
como valor crítico o FIV igual a 5 (LEVINE et al, 2005).
No menu Dados clique em Análise de Dados.
Na caixa de diálogo Análise de Dados dê um duplo clique em Regressão.
Com o Excel ativo, e com os dados já dispostos em sua área de trabalho (Tabela 2.1), no menu
Dados clique em “Análise de Dados”.
Figura 2.1
Na caixa de diálogo Análise de Dados escolha “Correlação” e clique em “OK”.
18
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
No campo Intervalo de Entrada deve ser fornecido o intervalo que contêm todas as variáveis
envolvidas na regressão, que neste exemplo são seis: PU, X1, X2, X3, X4 e X5. Portanto,
selecione B1 e arraste até G22.
Marque a opção Rótulos na primeira linha, pois em nossa seleção incluímos com os dados seus
respectivos rótulos.
Marque em Opções de saída o botão Intervalo de saída. Para inserir a referência para a célula
superior esquerda da tabela de saída, clique no campo que está imediatamente à direita do botão
intervalo de saída e insira a referência de célula “A24”. Clique em OK.
O resultado será uma tabela de Correlação como a mostrada na Figura 2.2:
Figura 2.2
De posse das Correlações entre os dados, deve-se verificar se há alguma correlação superior a
0,70 entre variáveis independentes. Segundo Dantas (2005) correlações acima de 0,7 podem ser
prejudiciais ao modelo. No exemplo, as variáveis “número de banheiros” e “numero de quartos”
apresentam correlação igual a 0,90, o que é prejudicial ao modelo, uma das duas variáveis deve
ser excluída do modelo. Para determinar qual variável a ser excluída será calculado o FIV através
do PHStat.
Para o cálculo do FIV utilizaremos o PHStat2. Na barra de ferramentas abra o menu
“Suplementos”, clique em “PHStat”, clique em “Regression” e clique em “Multiple
Regression”
Configure o PHStat conforme mostrado na Figura 2.3, selecione a opção “Variance
inflationary factor (VIF)” e clique em “OK”
19
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
O PHStat criará varias planihas contendo o FIV de cada variável, deve-se verificar se existe
alguma variavel com FIV maior que 5, caso exista, deve-se excluir a variavel. Caso exista 2
variáveis com FIV maior que 5 deve-se excluir a variavel com maior FIV e após proceder uma
nova verificação do FIV até que não haja nenhuma variável com FIV maior que 5.
Figura 2.3
Os FIVs calculados são:
-Numero de quartos: FIV = 10,119
-Numero de banheiros: FIV = 7,448
-Vagas de garagem: FIV = 1,532
-Estado de conservação: FIV = 1,385
-Área de lazer: FIV = 1,893
As variaveis “número de quartos” e “numero de banheiros” possuem FIV maior que 5, porém o
FIV da variavel numero de quartos é maior, deve-se excluir a variavel „numero de quartos” e
fazer nova verficação do FIV.
Após a exclusão da variável numero de quartos a planilha deve ficar como a Tabela 2.2:
20
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
N. de
registro
Preço
Número de
banheiros (X1)
Vagas de
garagem
(X2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
450
400
500
500
350
600
350
300
450
350
500
500
500
350
400
300
500
450
400
480
420
2
1
2
2
1
2
1
1
1
1
2
2
2
1
1
1
2
1
1
2
2
1
1
1
2
1
2
1
1
1
1
1
1
2
1
1
1
1
1
1
1
1
Estado de
Área de
conservação
lazer (X4)
(X3)
2
3
2
3
2
1
2
2
1
2
2
2
2
2
2
2
2
1
2
3
3
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
0
Tabela 2.2
Após refazer os cálculos do FIV, devem-se obter os seguintes resultados:
-Numero de banheiros: FIV = 1,495
-Vagas de garagem: FIV = 1,407
-Estado de conservação: FIV = 1,207
-Área de lazer: FIV = 1,358
Como todos os FIVs são menores que 5 não há problema de colinearidade no modelo com 4
variáveis independentes.
3.3.
Calculo das Estatísticas de Regressão e Anova
No menu “Dados” clique em “Análise de Dados”. Na caixa de diálogo Análise de Dados
escolha “Regressão” e clique em “OK”.
O Excel exibirá a caixa de diálogo Regressão. No campo Intervalo Y de entrada, vamos inserir
as referências de células que contém os dados da variável dependente, que neste exemplo é
Preço. Clique em B1 e arraste o mouse até B22.
21
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
No campo Intervalo X de entrada, vamos inserir as referências de células que contém os dados
das variáveis dependentes, que neste exemplo são X1, X2, X3 e X4. Clique no campo Intervalo
X de entrada. Selecione a célula C1 e arraste o mouse até a célula F22, a referência de célula
aparecerá automaticamente no referido campo.
Como na referência dos dados dependentes e independentes, nos referimos aos dados com seus
respectivos rótulos, marque a opção Rótulos.
Dado que estamos trabalhando com um intervalo de confiança de 80% marque o botão Intervalo
de confiança e substitua o valor padrão de 95% por 80%. Em Opções de saída marque o botão
Intervalo de saída para introduzir uma referência de célula.
Selecione as opções: Resíduos, Resíduos Padronizados e Plotar Resíduos
Clique no campo à direita do botão. Selecione a célula A31. A configuração da caixa de diálogo
Regressão se parecerá como a mostrada na Figura 2.4. Clique em OK.
Figura 2.4
O resultado será a tabela de regressão como mostrada na Figura 2.5:
22
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Figura 2.5
As tabelas de Regressão, Anova, Resíduos e Correlação gerada pelo Microsoft Excel estão
apresentadas abaixo:
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo
R-Quadrado
R-quadrado ajustado
Erro padrão
Observações
0,91573
0,83856
0,79821
35,39676
21
ANOVA
gl
Regressão
Resíduo
Total
4
16
20
SQ
MQ
104134,06220 26033,51554
20046,89023 1252,93064
124180,95240
F
20,77810
F de
significação
3,55556E-06
23
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Coeficientes
Erro padrão
Stat t
valor-P
95%
inferiores
95%
superiores
Interseção
Número de
banheiros (X1)
Vagas de garagem
(X2)
Estado de
conservação (X3)
302,88334
39,27305
7,71224 8,89007E-07
219,62820
386,13849
108,66723
18,91222
5,74587 3,00723E-05
68,57510
148,75937
61,80280
26,18965
2,35982 0,031321044
6,28322
117,32238
-55,24505
14,75194
-3,74493 0,001766555
-86,51778
-23,97232
Área de lazer (X4)
53,25881
22,92891
2,32278 0,033699697
4,65167
101,86595
Inferior
80,0%
250,38482
83,38618
26,79360
-74,96482
22,60841
Superior
80,0%
355,38187
133,94829
96,81201
-35,52528
83,90921
RESULTADOS DE RESÍDUOS
Observação Previsto(a) Preço
1
471,53
2
360,87
3
524,78
4
478,08
5
362,86
6
588,57
7
362,86
8
362,86
9
418,11
10
362,86
11
471,53
12
471,53
13
533,33
14
362,86
15
362,86
16
362,86
17
524,78
18
418,10
19
362,86
20
469,54
21
416,29
Resíduos
-21,53052
39,12295
-24,78933
21,91172
-12,86328
11,42161
-12,86328
-62,86328
31,89165
-12,86328
28,46947
28,46947
-33,33333
-12,86328
37,13671
-62,86328
-24,78933
31,89165
37,13671
10,45571
3,71453
Resíduos
padrão
-0,68005
1,23572
-0,78299
0,69209
-0,40629
0,36076
-0,40629
-1,98558
1,00732
-0,40629
0,89923
0,89923
-1,05285
-0,40629
1,17299
-1,98558
-0,78299
1,00732
1,17299
0,33025
0,11732
24
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Através das estatísticas de regressão e da tabela Anova, obtivemos a seguinte equação de
regressão:
PÛ  302,88  108,66  X 1  61,80  X 2  55,25  X 3  53,26  X 4
Substituindo os valores das variáveis independentes do imóvel avaliando:
-Numero de banheiros (X1): 2
- Numero de vagas de garagem (X2): 1
-Estado de conservação (X3): 2
-Área de lazer (X4): 0
Temos que o valor previsto para o aluguel do imóvel é:
PÛ = R$ 471,53
3.4.
Determinação do Intervalo de Confiança
Para o cálculo do Intevalo de confiança utilizaremos o PHStat2. Na barra de ferramentas abra o
menu “Suplementos”, clique em “PHStat”, clique em “Regression” e clique em “Multiple
Regression”
Configure o PHStat conforme mostrado na figura 2.6. Clique em OK, o PHStat criará um nova
planilha com nome “Intervals” com os intervalos de confiança para o preço previsto e para uma
nova observação.
Nas células B6:B9 deve-se informar os valores das variáveis independentes do imóvel avaliando.
Para o imóvel avaliando desta apostila devem-se preencher os campos como segue descrito na
tabela 2.3:
Data
Confidence Level
Número de banheiros (X1) given value
Vagas de garagem (X2) given value
Estado de conservação (X3) given value
Área de lazer (X4) given value
80%
1
2
1
2
0
Tabela 2.3
25
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Figura 2.6
Nas células A29:B39, o PHStat fornece o valor previsto para o imóvel e os intervalos de
confiança para o valor previsto e para uma resposta individual, conforme abaixo.
Predicted Y (YHat)
471,53
For Average Predicted Y (Yhat)
Interval Half Width
Confidence Interval Lower Limit
Confidence Interval Upper Limit
21,89
449,64
493,42
For Individual Response Y
Interval Half Width
Prediction Interval Lower Limit
Prediction Interval Upper Limit
52,13
419,39
523,67
Tabela 2.4
Intervalo de confiança para o valor previsto:
R$ 449,64 < PÛ < R$ 493,43
26
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
A NBR 14653-2:2003 sugere a classificação da avaliação quanto ao Grau de Precisão (item
9.2.2). O nível de precisão é encontrado através do valor em porcentagem da amplitude do
intervalo de confiança de 80% sobre o valor pontual da avaliação.
AMPLITUDE 
PÛ sup  PÛ inf
PÛ

493,43  449,64
 0,093  9,3 %
471,53
Como a amplitude é menor do que 30% ,através da Tabela 1.7 podemos classificar a avaliação
com Grau de Precisão 3
O intervalo para uma resposta individual de Y não é de interesse para a avaliação (Ver item
2.2 desta apostila).
3.5.
Teste de hipóteses
Testada a hipótese nula da regressão (ß1 = 0) pelo teste F, a mesma foi rejeitada ao nível de
1%, uma vez que:
F de sifnificaç ão  3,55  10 6  0,01
( F de significaç ão está localizado na célula F42 da tabela do Excel)
OBS: F de significação é o nível de significância em que se aceita a hipótese nula da regressão.
Caso fosse aceita a hipótese nula da regressão a equação obtida não poderia ser utilizada para
explicar o comportamento dos valores de mercado dos imóveis.
Testada a hipótese nula dos regressores (ß1 =0), a mesma foi rejeitada ao nível de 5%, uma vez
que:
Valor P ( X 1)  3,01 10 5  0,05
Valor P ( X 2)  0,031  0,05
Valor P ( X 3)  0,001  0,05
Valor P ( X 4)  0,034  0,05
(Valor P das variáveis está localizado nas células E47:E51)
OBS: Valor P é o nível de significância em que se aceita a hipótese nula dos regressores.
Caso alguma variável independente tivesse a hipótese nula aceita, ela poderia ser excluída do
modelo, e dever-se-ia recalcular as estatísticas de regressão, tabela Anova, e tabela de resíduos.
27
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
3.6.
Verificação das hipóteses básicas
Deve-se proceder a verificação das 5 hipóteses básicas descritas na Regressão Linear Simples e
verificar uma nova hipótese que só se aplica a Regressão Múltipla.
Sexta hipótese: Não deve existir nenhuma relação exata entre quaisquer variáveis
independentes.
Para proceder esta verificação deve-se consultar a tabela de correlações e assegurar que não
exista nenhuma correlação igual a 1 entre duas variáveis independentes.
TABELA DE CORRELAÇÃO
Preço
Preço
Número de banheiros
Vagas de garagem
Estado de conservação
Área de lazer
1
0,794124877
0,543532721
-0,14093509
0,246310115
Número de
banheiros
Vagas de
garagem
Estado de
conservação
1
0,428174419
1
0,252509201 -0,03378687
1
0,265935942 -0,19802951 0,381375432
Área de
lazer
1
No modelo não existe nenhum correlação igual a 1 entre duas variáveis independentes, então, se
aceita a sexta hipótese.
Obs. Neste exemplo, estamos supondo a amostra já saneada, isto é, isenta de dados supostamente
discrepantes. Mais tarde será ilustrado como proceder para sanear uma amostra utilizando o
critério de Chauvenet.
4. Exemplos Resolvidos
4.1. Um corretor de imóveis quer saber se em determinado bairro da cidade
(representado pela amostra abaixo - tab. 3.1) se a dimensão da frente de um terreno ou sua
testada, influi ou não na formação de preços unitários (R$/m2). Esse é um problema típico que
pela aplicação de inferência estatística, podemos afirmar se a dimensão da frente dos terrenos
influi ou não na formação de seus preços unitários.
Amostra
1
2
3
4
5
6
Frente (m) Profund. (m)
15,00
31,50
15,00
30,00
15,00
37,65
12,00
30,00
15,00
30,00
12,00
30,00
Planilha 4.1.1
R$/m2
31,75
44,44
31,87
38,85
51,11
36,11
28
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Resolução:
1º) Saneamento da amostra (Critério de Chauvenet)
Consiste em se eliminar os registros da amostra, cujos preços (Pori) distem mais do que um certo
limite (dlim) da média de preços da amostra, ou seja, elimina-se todos os registros cujos preços
(Pori) estiverem fora do intervalo:
(Pori - dlim) ≤ Pori (i) ≤ (Pori + dlim)
Com dlim = Sp x (d/Sp)crítico, onde:
n
Sp 
 ( Pori(i)  Pori)
2
i 1
n 1
Sp é o desvio padrão dos preços da amostra, dado por:
e (d/Sp)crítico uma função da quantidade de registros da amostra, conforme a seguir:
5
n=
(d/Sp)crítico 1,65
6
1,73
7
1,80
8
1,86
9
1,92
10
1,96
11
n=
(d/Sp)crítico 1,98
12
2,03
13
2,05
14
2,10
15
2,12
16
2,16
17
n=
(d/Sp)crítico 2,18
18
2,20
19
2,23
20
2,24
21
2,26
22
2,28
24
n=
(d/Sp)crítico 2,31
26
2,35
30
40
2,39
2,50
Tabela 4.1.2
50
2,58
Com a tabela 3.1 inserida no Microsoft Excel, utilize as funções MÉDIA e DESVPAD para
calcular Pori que é a média aritmética dos preços unitários (R$/m2) e Sp que é o desvio padrão dos
preços da amostra. Daí, vem que:
Sp = 7,59 e Pori = 39,02, n = 6 e dlim = 7,59*1,73 = 13,13, de modo que o intervalo:
(Pori - dlim) ≤ Pori (i) ≤ (Pori + dlim) é igual a:
(39,02 – 13,13) ≤ Pori (i) ≤ (39,02 + 13,13) = 25,89 ≤ Pori (i) ≤ 52,15
29
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Com isto, concluímos que a amostra não tem nenhum dado supostamente discrepante. Isto é, a
amostra já está saneada.
2º) Cálculo das Correlações, Regressores e Anova.
Correlações:
Frente (m)
Frente (m)
Profund. (m)
R$/m2
Profund. (m)
R$/m2
1
0,38602956
1
0,15734108 -0,56507026
Estatística de regressão
R múltiplo
0,69640049
R-Quadrado
0,48497365
R-quadrado
0,14162275
ajustado
Erro padrão
7,03174433
Observações
6
ANOVA
gl
Regressão
2
Resíduo
3
Total
5
Coeficientes
Interseção
66,2600311
Frente (m)
2,16161984
Profund. (m)
-1,8239823
95%
Inferior 80,0%
superiores
183,4225108
5,9661244
9,164455972 -1,44216483
1,721331482 -3,64846416
1
SQ
139,680598
148,336285
288,016883
Erro padrão
36,8151914
2,2004549
1,11402051
Superior
80,0%
126,5539377
5,765404507
0,000499551
MQ
F
F de significação
69,8402992 1,4124723
0,369610395
49,4454283
Stat t
Valor-P
1,79980135 0,1697137
0,98235135 0,3983645
-1,63729688 0,2000917
95% inferiores
-50,90244869
-4,84121629
-5,369296092
Tabela 4.1.3
3º) Teste de hipótese nula da regressão (ß1 = 0 e ß2 = 0)
Testada a hipótese nula da regressão (ß1 = 0 e ß2 = 0), ambas foram aceitas, uma vez que:
Fcalculado= 1,4124723 < F (λ) (k), (n-k-1) = F (1%) (2), (3) = 30,81 (tabelado)
Isto significa que ß1 e ß2 não são variáveis influenciantes ao nível de significância de 1% ou sua
influência é muito reduzida na formação do preço unitário dos terrenos. Como a hipótese nula do
teste foi aceita, poderíamos concluir nossa análise nesta etapa. Mas para ilustrar o roteiro
normalmente adotado quando a hipótese nula é rejeitada, vamos continuar os testes.
30
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
4º) Teste de hipótese nula dos regressores (ß1 = 0 ou ß2 = 0)
Testada a hipótese nula dos regressores (ß1 = 0 ou ß2 = 0), a primeira foi aceita, uma vez :
t1 
b1
QMR
2,16161984

SQ x1 .SQ x 2  ( S x1x 2 ) 2
SQ x 2
49,44

2,161
 0,982
2,200
12 * 46,82  (9,15) 2
46,82
|t1| = 0,982 < t (n-k-1),  = t (3),5% = 2,3534
Isto significa que ß1 não influi decisivamente e suficientemente na formação de preços para ser
incluído na equação de regressão. Isto é, a equação que melhor representa a formação de preços
dos terrenos desta amostra, é uma equação que não envolve a variável frente do terreno.
t2 
b2
QMR
SQ x1 .SQ x 2  ( S x1x 2 ) 2
SQ x1

 1,823
49,44

 1,823
 1,636
1,114
12 * 46,82  (9,15) 2
12,00
|t2| = 1,636 < t (n-k-1),  = t (3),5% = 2,3534
Assim temos também que ß2 não influi decisivamente na formação de preços, com um nível de
confiança de 90%, para fazer parte da equação que procura descrever a variação de preços no
mercado imobiliário da região de coleta das amostras. Deste modo, não podemos obter, a partir
dos dados da tab. 3.1, uma equação que represente o preço unitário dos terrenos de forma
eficiente.
Como esperávamos, este teste apenas confirmou o que já havíamos concluído no 4.º passo:
Entretanto, como a amostra é muito pequena, pode acontecer desta não ser representativa, isto é,
corre-se o risco de ser tendenciosa. Daí deveríamos suspeitar que a amostra não é de fato
representativa, tendo em vista que a bibliografia técnica afirma que a frente ou testada do terreno
influi decisivamente na formação de seu preço unitário.
4.2. A tabela a seguir se refere a uma pesquisa de terrenos urbanos em uma dada área
central de uma cidade X. A pesquisa concentrou-se ao longo das Avenidas AP e PF, duas vias de
comércio intenso e nas ruas transversais até uma distância máxima de 270m. Registrou-se os
preços dos terrenos em oferta, suas áreas e distância às referidas avenidas. Verifique se pode ou
não obter uma equação de regressão a partir da amostra abaixo.
31
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Registro n.º
VT
1
170000
2
100000
3
150000
4
180000
5
1080000
6
700000
7
50000
8
20000
9
55000
10
18000
ÁREA
422
360
2055
901
7200
8057
430
280
360
200
DIST.
0
0
110
40
70
270
40
40
40
40
(esquina)
(esquina)
(esquina)
(esquina)
Planilha 4.2.1
Resolução:
1º) Saneamento da amostra (Critério de Chauvenet)
(Pori – dlim) ≤ Pori (i) ≤ (Pori + dlim)
Como: dlim = Sp x (d/Sp)crítico
Sp = 352750,5, Pori = 252300, n =10 e (d/Sp)crítico = 1,96
dlim = 352750,5 * 1,96 = 691390,94
(Pori – dlim) ≤ Pori (i) ≤ (Pori + dlim)
252300 – 691390,94 ≤ Pori (i) ≤ 252300 + 691390,94
-439090,94 ≤ Pori (i) ≤ 943690,94
Como o registro n.º 5 está fora do intervalo acima, concluímos que se trata de um dado espúrio,
portanto, será eliminado e não considerado para fins de inferência estatística.
Vamos recalcular novamente o intervalo para o critério de Chauvenet para verificar se existe
mais algum dado discrepante.
Sp = 211745,13, Pori = 160333,33, n = 9 e (d/Sp)crítico = 1,92
dlim = 211745,13*1.92 = 406550,65
(Pori – dlim) ≤ Pori (i) ≤ (Pori + dlim)
160333,33 – 406550,65 ≤ Pori (i) ≤ 160333,33 + 406550.65
-246217 ≤ Pori (i) 566883,98
32
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Desta forma, o registro nº 6, também constitui um dado espúrio, de modo que, deveremos
recalcular um novo intervalo:
Sp = 66593,52,
Pori = 92875, n = 8 e (d/Sp)crítico = 1,86
dlim = 66593,52*1.86 = 123863,94
(Pori – dlim) ≤ Pori (i) ≤ (Pori + dlim)
-30988,94 ≤ Pori (i) ≤ 216738,94
Com isto, a amostra já está saneada.
2º) Cálculo das Correlações, Regressores e Anova.
Registro
n.º
1
2
3
4
5
6
7
8
VT
Área
DIST.
170000
100000
150000
180000
50000
20000
55000
18000
422
360
205
901
430
280
360
200
0
0
110
40
40
40
40
40
(esquina)
(esquina)
CORRELAÇÕES
VT
VT
Área
DIST.
Área
1
0,571241
0,0396682
DIST.
1
0,813187
1
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo
0,926914
R-Quadrado
0,859169
R-quadrado
0,802837
ajustado
Erro padrão
29569,56
Observações
8
ANOVA
gl
Regressão
Resíduo
SQ
2 2,67E+10
5 4,37E+09
MQ
F
F de signific.
1,33E+10 15,25179
0,007443
8,74E+08
33
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Total
7
Coeficientes
3,1E+10
Erro
padrão
Interseção
80100,28 16575,96
Área
172,5055 31,26266
DIST.
-2457,27 564,9533
Inferior
Superior
80,0%
80,0%
55636,08 104564,5
126,3654 218,6456
-3291,07 -1623,46
Stat t
valor-P
95% inferiores
95%
superiores
37490,5
122710,1
92,14243
252,8686
-3909,52
-1005,01
4,832317 0,004747
5,517941 0,002677
-4,34951 0,007363
Tabela 4.2.1
3º) Teste de hipótese nula da regressão (ß1 = 0 e ß2 = 0)
Testada a hipótese nula da regressão (ß1 = 0 e ß2 = 0), ambas foram aceitas , uma vez que:
Fcalculado= 15,25179 < F (λ) (k), (n-k-1) = F (1%) (2), (5) = 13,27 (tabelado)
Como rejeitamos a hipótese de nulidade de ß1 e ß2 , então, a equação de regressão obtida pela
modelagem é significante ao nível de 1% para explicar o comportamento de mercado.
4.3.
A tabela a seguir se refere a uma pesquisa de apartamentos na cidade de
Campo Grande - MS. Registrou-se os preços dos apartamentos em oferta, suas áreas, valores de
condomínio, número de vagas de garagem, se posui portaria, quadra, piscina e Sacada. Pretendese encontrar o valor de mercado de um imóvel com as seguintes características:
Área = 115m²
Condomínio = R$ 150,00
Garagem = 1 vaga
Portaria = Possui (Recebe valor 1 por se tratar de uma variável dicotômica)
Armário = Não Possui (Recebe valor 0 por se tratar de uma variável dicotômica)
Quadra = Possui (Recebe valor 1 por se tratar de uma variável dicotômica)
Piscina = Não Possui (Recebe valor 0 por se tratar de uma variável dicotômica)
Sacada = Possui (Recebe valor 1 por se tratar de uma variável dicotômica)
Nº
registro
1
2
3
4
5
Residencial
Cachoeirinha
II
Itacolomi
Via Park
Dominica
Valor
Área
Cond.
Garagem Portaria Armário Quadra Piscina Sacada
R$ 140.000
118
R$ 255
2
1
1
1
0
0
R$ 145.000
R$ 185.000
R$ 145.000
R$ 95.000
98
103
107
73
R$ 350
R$ 0
R$ 220
R$ 180
1
2
2
1
1
0
1
1
1
1
0
0
1
0
0
0
1
0
1
1
1
0
1
1
34
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
Tacuma
Cachoeirinha
II
Vitoria
Monte
Castelo
Sevilha
Parque dos
coqueiros
Cedro
Marques de
Labradil
Las Palmas
Sam Lorenço
Mangaratiba
Nova Suécia
Nova
Portugal
Nova
Inglaterra
R$ 195.000
154
R$ 0
2
0
1
0
0
1
R$ 130.000
102
R$ 255
1
1
1
1
0
0
R$ 140.000
R$ 210.000
70
122
R$ 0
R$ 240
1
1
0
1
1
0
0
1
0
1
0
1
R$ 185.000
116
R$ 260
2
1
0
1
0
1
R$ 90.000
80
R$ 220
1
1
1
1
0
1
R$ 75.000
72
R$ 150
1
0
1
0
0
1
R$ 90.000
78
R$ 215
1
1
1
1
1
1
R$ 110.000
90
R$ 110
1
1
0
0
0
1
R$ 95.000
R$ 85.000
R$ 125.000
R$ 85.000
R$ 105.000
93
87
76
87
110
R$ 130
R$ 180
R$ 275
R$ 190
R$ 200
1
1
2
1
2
1
1
1
1
1
1
0
0
0
1
0
0
1
0
0
0
0
1
0
0
0
0
1
0
0
R$ 93.000
110
R$ 215
2
1
1
0
0
0
R$ 100.000
110
R$ 200
2
1
1
0
0
0
Planilha 4.3.1
1º) Verificação da colinearidade.
Supondo a amostra já saneada pelo critério de Chauvenet, calcula-se a tabela de
correlações obtendo o seguinte resultado:
Valor
Valor
Área
Cond.
Garagem
Portaria
Armário
Quadra
Piscina
Sacada
1,00
0,66
-0,15
0,36
-0,29
-0,10
0,29
0,16
0,22
Área
1,00
-0,05
0,58
-0,04
0,12
0,03
-0,17
-0,05
Cond.
1,00
-0,02
0,78
-0,21
0,66
0,45
0,22
Garagem Portaria Armário Quadra Piscina Sacada
1,00
-0,07
0,08
-0,08
-0,12
-0,14
1,00
-0,38
0,38
0,31
0,02
1,00
0,01
-0,37
-0,36
1,00
0,37
0,36
1,00
0,60
1,00
Tabela 4.3.1
35
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Verifica-se que a variável “condomínio” possui uma correlação alta com a variável
“portaria”, faremos o cálculo dos FIVs para verificar se alguma variável deve ser excluída do
modelo.
Os FIVs calculados são:
- Área: FIV = 1,66
- Condomínio: FIV = 4,78
- Garagem: FIV = 1,64
- Portaria: FIV = 3,72
- Armário: FIV = 1,66
- Quadra: FIV = 2,24
- Piscina: FIV = 1,99
- Sacada: FIV = 2,09
Como todos os FIVs são menores que 5 não há problema de colinearidade no modelo.
2º) Calculo da estatística de regressão e anova.
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo
0,935055217
R-Quadrado
0,874328258
R-quadrado
ajustado
0,790547097
Erro padrão
18540,55309
Observações
21
ANOVA
gl
Regressão
Resíduo
Total
Interseção
Área
Cond.
Garagem
Portaria
Armário
Quadra
Piscina
SQ
MQ
8 2,87E+10 3,59E+09
12 4,125E+09 3,44E+08
20 3,282E+10
Coeficientes
61518,859
1328,125
-141,130
1530,987
-50393,393
-33156,881
51370,673
29013,363
Erro
padrão
25665,059
256,993
98,052
10479,344
19875,963
10723,162
12464,005
12644,275
Stat t
2,397
5,168
-1,439
0,146
-2,535
-3,092
4,122
2,295
F
10,44
F de
significação
0,0002353
valor-P 95% inferiores
0,034
5599,498
0,000
768,186
0,176
-354,768
0,886
-21301,543
0,026
-93699,397
0,009
-56520,644
0,001
24213,938
0,041
1463,853
95%
superiores
117438,219
1888,064
72,508
24363,516
-7087,390
-9793,117
78527,407
56562,872
36
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Sacada
-18193,101 11705,927
-1,554
0,146
-43698,125
7311,923
Tabela 4.3.2
3º) Teste de hipótese nula da regressão
Pelo teste F, a mesma foi rejeitada ao nível de 1%, uma vez que:
F de sifnificaç ão  0,0002353  0,01 (O modelo é significativo)
4º) Teste de hipótese nula dos regressores
Testando as variáveis ao nível de 20%, tem-se:
Área - Valor P  0,00  0,20 (Significativa para o modelo)
Condominio - Valor P  0,18  0,20 (Significativa para o modelo)
Garagem - Valor P  0,88  0,20 (Não é significativa para o modelo)
Portaria - Valor P  0,03  0,20 (Significativa para o modelo)
Armário - Valor P  0,01  0,20 (Significativa para o modelo)
Quadra - Valor P  0,00  0,20 (Significativa para o modelo)
Piscina - Valor P  0,04  0,20 (Significativa para o modelo)
Sacada - Valor P  0,15  0,20 (Significativa para o modelo)
5º) Análise crítica dos valores obtidos na regressão
Ao término do calculo das estatísticas de regressão e dos testes de hipóteses devemos verificar se
o modelo realmente serve para explicar o comportamento real do mercado imobiliário. A priori
esta tudo correto em nosso modelo, mas vamos nos atentar aos coeficientes obtidos para as
variáveis: Portaria, Armário e Sacada.
Coeficientes:
-Portaria = R$ -50393,39
-Armário = R$ -33156,88
-Sacada = R$ -18193,10
Os coeficientes negativos para estas variáveis não condizem com a realidade. Podemos ver
através do exemplo:
Um apartamento que não possua Armário Embutido tem um valor de mercado, se o seu
proprietário resolver investir na instalação de Armário Embutido no apartamento seu
apartamento, este investimento ira agregar valor ao imóvel, ao contrário do que diz o modelo,
cujo diz que se o proprietário investir na instalação de armário embutido o valor do imóvel irá
diminuir em R$ 33156,88.
Para tentar descobrir o que esta afetando o modelo de regressão plota-se gráficos das variáveis
explicativas versus variável explicada, conforme demonstrado a seguir:
37
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Gráfico 4.3.1
Pontos indicados pelas setas correspondem as amostras: 3, 6, 8, 9 e 10
Gráfico 4.3.2
Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10
38
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Gráfico 4.3.3
Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10
Gráfico 4.3.4
Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10
39
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Gráfico 4.3.5
Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10
Gráfico 4.3.6
Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10
40
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Gráfico 4.3.7
Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10
Gráfico 4.3.8
Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10
A plotagem desses gráficos é feita para verificar a existência de pontos influenciantes. “Entendese por pontos influenciantes aqueles com pequenos resíduos, em algumas vez até nulos, mas que
se distanciam da massa de dados, podendo alterar completamente as tendências naturais indicadas
pelo mercado (DANTAS, 2005, p. 113).”
41
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Pode-se concluir então que as amostras 3, 6, 9, 10 são pontos influenciantes no modelo, a solução
é excluir esses dados de nossa amostra e proceder a analise de regressão novamente.
Após a exclusão a planilha deve ficar como a planilha 4.3.2:
Nº
registro
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Residencial
Cachoeirinha
II
Itacolomi
Dominica
Cachoeirinha
II
Vitoria
Sevilha
Parque dos
coqueiros
Cedro
Marques de
Labradil
Las Palmas
Sam Lorenço
Mangaratiba
Nova Suécia
Nova
Portugal
Nova
Inglaterra
Valor
Área Cond.
Garagem Portaria Armário Quadra Piscina Sacada
R$ 140.000
118
R$ 255
2
1
1
1
0
0
R$ 145.000
R$ 145.000
R$ 95.000
98
107
73
R$ 350
R$ 220
R$ 180
1
2
1
1
1
1
1
0
0
1
0
0
1
1
1
1
1
1
R$ 130.000
102
R$ 255
1
1
1
1
0
0
R$ 140.000
R$ 90.000
70
80
R$ 0
R$ 220
1
1
0
1
1
1
0
1
0
0
0
1
R$ 75.000
72
R$ 150
1
0
1
0
0
1
R$ 90.000
78
R$ 215
1
1
1
1
1
1
R$ 110.000
90
R$ 110
1
1
0
0
0
1
R$ 95.000
R$ 85.000
R$ 125.000
R$ 85.000
R$ 105.000
93
87
76
87
110
R$ 130
R$ 180
R$ 275
R$ 190
R$ 200
1
1
2
1
2
1
1
1
1
1
1
0
0
0
1
0
0
1
0
0
0
0
1
0
0
0
0
1
0
0
R$ 93.000
110
R$ 215
2
1
1
0
0
0
R$ 100.000
110
R$ 200
2
1
1
0
0
0
Planilha 4.3.2
*Observe que o número de registro das amostras foram alterados para que não haja confusão
quanto ao número real de amostras do modelo.
Verificando se ainda existem pontos influenciantes no modelo, plota-se o gráfico do Valor x Área
(Gráfico 4.3.9), que supostamente é a variável que mais influencia no modelo.
Como demonstrado no gráfico 4.3.9, ainda existem pontos influenciantes no modelo.
42
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Gráfico 4.3.9
Pontos indicados pelas setas correspondem as amostras: 2, 6, 13 e 17
Procedendo novamente a exclusão das amostras que foram consideradas como pontos
influenciantes, temos uma nova planilha:
Nº
registro
1
2
3
4
5
6
7
8
9
10
11
12
13
Residencial
Cachoeirinha
II
Dominica
Cachoeirinha
II
Sevilha
Parque dos
coqueiros
Cedro
Marques de
Labradil
Las Palmas
Mangaratiba
Nova Suécia
Nova
Portugal
Valor
Área Cond.
Garagem Portaria Armário Quadra Piscina Sacada
R$ 140.000
118
R$ 255
2
1
1
1
0
0
R$ 145.000
R$ 95.000
107
73
R$ 220
R$ 180
2
1
1
1
0
0
0
0
1
1
1
1
R$ 130.000
102
R$ 255
1
1
1
1
0
0
R$ 90.000
80
R$ 220
1
1
1
1
0
1
R$ 75.000
72
R$ 150
1
0
1
0
0
1
R$ 90.000
78
R$ 215
1
1
1
1
1
1
R$ 110.000
90
R$ 110
1
1
0
0
0
1
R$ 95.000
R$ 85.000
R$ 85.000
R$ 105.000
93
87
87
110
R$ 130
R$ 180
R$ 190
R$ 200
1
1
1
2
1
1
1
1
1
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
R$ 93.000
110
R$ 215
2
1
1
0
0
0
Planilha 4.3.3
6º) Calculo da estatística de regressão e anova para a nova planilha.
43
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo
0,97
R-Quadrado
0,94
R-quadrado
ajustado
0,83
Erro padrão
Observações
9070,31
13,00
ANOVA
gl
Regressão
Resíduo
Total
8
4
12
F de
SQ
MQ
F
significação
5,58E+09 6,98E+08 8,48396
0,02767
3,29E+08 8,23E+07
5,91E+09
Coeficientes Erro padrão
Interseção
Área
Cond.
Garagem
Portaria
Armário
Quadra
Piscina
Sacada
-100482,85
2810,96
30,86
-38747,74
-23408,23
-12745,33
10060,42
18423,20
19958,17
55292,778
599,113
162,813
19758,679
14971,673
9749,310
17584,117
10288,165
12599,302
Stat t
valor-P
-1,817
4,692
0,190
-1,961
-1,564
-1,307
0,572
1,791
1,584
0,143
0,009
0,859
0,121
0,193
0,261
0,598
0,148
0,188
95%
inferiores
95%
superiores
254000,212
1147,557
-421,186
-93606,632
-64976,258
-39813,757
-38760,919
-10141,328
-15023,101
53034,513
4474,366
482,899
16111,143
18159,800
14323,090
58881,752
46987,722
54939,439
Tabela 4.3.3
Como possuímos apenas 13 amostras devemos escolher no máximo 3 variáveis para o
modelo, pois a norma exige que n  3(k  1) , onde k é o numero de variáveis independentes.
Serão escolhidas as variáveis: área, piscina e sacada, pois apresentem coeficiente com sinal
coerente com a realidade de mercado e são significantes ao nível de 20%.
Temos então uma nova planilha contendo apenas as 3 variáveis escolhidas.
44
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Nº
registro
Residencial
Cachoeirinha
II
Dominica
Cachoeirinha
II
Sevilha
Parque dos
coqueiros
Cedro
Marques de
Labradil
Las Palmas
Mangaratiba
Nova Suécia
Nova
Portugal
1
2
3
4
5
6
7
8
9
10
11
12
13
Valor
Área
Piscina Sacada
R$ 140.000
118
0
0
R$ 145.000
R$ 95.000
107
73
1
1
1
1
R$ 130.000
102
0
0
R$ 90.000
80
0
1
R$ 75.000
72
0
1
R$ 90.000
78
1
1
R$ 110.000
90
0
1
R$ 95.000
R$ 85.000
R$ 85.000
R$ 105.000
93
87
87
110
0
0
0
0
0
0
0
0
R$ 93.000
110
0
0
Planilha 4.3.4
7º) Calculo da estatística de regressão e anova para planilha com 3 variáveis.
RESUMO DOS RESULTADOS
Estatística de regressão
R múltiplo
0,853295582
R-Quadrado
0,72811335
R-quadrado
ajustado
0,637484466
Erro padrão 13365,14891
Observações
13
ANOVA
gl
Regressão
Resíduo
Total
3
9
12
SQ
MQ
4,31E+09 1435092742
1,61E+09 178627205,5
5,91E+09
F de
F
significação
8,034
0,0065
45
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Coeficientes Erro padrão
Interseção
Área
Piscina
Sacada
-43408,756
1466,565
10511,655
16772,531
32710,009
319,976
11045,229
11286,761
Stat t
valor-P
-1,327
4,583
0,952
1,486
95%
inferiores
95%
superiores
0,217 117403,937 30586,425
0,001
742,728 2190,401
0,366 -14474,389 35497,698
0,171
-8759,895 42304,958
RESULTADOS DE RESÍDUOS
Observação Previsto(a) Valor Resíduos Resíduos padrão
1
129645,89 10354,11
0,89
2
140797,86
4202,14
0,36
3
90934,66
4065,34
0,35
4
106180,85 23819,15
2,06
5
90688,96
-688,96
-0,06
6
78956,44 -3956,44
-0,34
7
98267,48 -8267,48
-0,71
8
105354,60
4645,40
0,40
9
92981,77
2018,23
0,17
10
84182,38
817,62
0,07
11
84182,38
817,62
0,07
12
117913,37 -12913,37
-1,12
13
117913,37 -24913,37
-2,15
Tabela 4.3.4
Observe que temos duas amostras com resíduos altos. Deve-se verificar a amostra quanto a
presença de outliers. “Entende-se por outlier um dado que contém grande resíduo em relação aos
demais que compõe a amostra. Estes pontos ponde ser detectados com facilidade através de uma
análise gráfica dos resíduos padronizados versus os valores previsto (DANTAS, 2005, p. 112).”
Plota-se o gráfico 4.3.10 Resíduos padrão x Previsto(a) Valor, através de uma analise visual é
possível identificar a presença de dois outliers indicados pelas setas correspondentes as amostras
4 e 13. Para prosseguir deve-se excluir as duas amostras do modelo, e conseqüente deve-se
excluir também uma variável, pois como teremos apenas 11amostras quando a norma exige no
mínimo 12 amostras para um modelo com 3 variáveis. Excluiremos a variável piscina, pois é a
única das 3 variáveis que não é significante para o modelo.
46
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Gráfico 4.3.10
Após a exclusão das amostras 4 e 13 e da variável piscina, a planilha ficara como a planilha
4.3.5.
Nº
registro
1
2
3
4
5
6
7
8
9
10
11
Residencial
Cachoeirinha
II
Dominica
Sevilha
Parque dos
coqueiros
Cedro
Marques de
Labradil
Las Palmas
Mangaratiba
Nova Suécia
Valor
Área
Sacada
R$ 140.000
118
0
R$ 145.000
R$ 95.000
R$ 90.000
107
73
80
1
1
1
R$ 75.000
72
1
R$ 90.000
78
1
R$ 110.000
90
1
R$ 95.000
R$ 85.000
R$ 85.000
R$ 105.000
93
87
87
110
0
0
0
0
Planilha 4.3.5
Continuaremos verificando a presença de outliers, para isso calculamos novamente a tabela de
resíduos da planilha 4.3.5.
RESULTADOS DE RESÍDUOS
47
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Observação
1
2
3
4
5
6
7
8
9
10
11
Previsto(a)
Valor
133096,72
139567,84
83921,08
95377,77
82284,41
92104,43
111744,46
92179,98
82359,97
82359,97
Resíduos
6903,28
5432,16
11078,92
-5377,77
-7284,41
-2104,43
-1744,46
2820,02
2640,03
2640,03
120003,36 15003,36
Resíduos
padrão
0,94
0,74
1,51
-0,73
-0,99
-0,29
-0,24
0,39
0,36
0,36
-2,05
Tabela 4.3.5
Plota-se novamente o gráfico Resíduos padrão x Previsto(a)
Gráfico 4.3.11
Através de uma analise visual é possível identificar a presença de dois outliers indicados pelas
setas, correspondentes as amostras 3 e 11. Para prosseguir deve-se excluir do modelo as amostras
3 e 11 e fazer nova verificação.
A nova planilha ficará como a planilha a seguir:
48
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Nº
registro
1
2
3
4
5
6
7
8
9
Residencial
Cachoeirinha
II
Sevilha
Parque dos
coqueiros
Cedro
Marques de
Labradil
Las Palmas
Mangaratiba
Valor
Área
Sacada
R$ 140.000
118
0
R$ 145.000
R$ 90.000
107
80
1
1
R$ 75.000
72
1
R$ 90.000
78
1
R$ 110.000
90
1
R$ 95.000
R$ 85.000
R$ 85.000
93
87
87
0
0
0
Planilha 4.3.6
Calculando novamente a tabela de resíduos:
RESULTADOS DE RESÍDUOS
Previsto(a)
Resíduos
Observação
Valor
Resíduos padrão
1 142164,20 -2164,20
-1,26
2 142632,03 2367,97
1,38
3 91841,99 -1841,99
-1,07
4 76793,09 -1793,09
-1,04
5 88079,77 1920,23
1,12
6 110653,12 -653,12
-0,38
7 95136,38 -136,38
-0,08
8 83849,71 1150,29
0,67
9 83849,71 1150,29
0,67
Tabela 4.3.6
49
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Plota-se novamente o gráfico Resíduos padrão x Previsto(a)
Gráfico 4.3.12
Através da analise visual, verifica-se que não há presença de outliers. Adota-se então este
conjunto de amostras para compor o modelo.
8º) Calculo da estatística de regressão e Anova para planilha com 2 variáveis e 9 amostras.
Nº
registro
1
2
3
4
5
6
7
8
9
Residencial
Cachoeirinha
II
Sevilha
Parque dos
coqueiros
Cedro
Marques de
Labradil
Las Palmas
Mangaratiba
Valor
Área
Sacada
R$ 140.000
118
0
R$ 145.000
R$ 90.000
107
80
1
1
R$ 75.000
72
1
R$ 90.000
78
1
R$ 110.000
90
1
R$ 95.000
R$ 85.000
R$ 85.000
93
87
87
0
0
0
Planilha 4.3.7
Estatística de regressão
50
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
R múltiplo
R-Quadrado
R-quadrado
ajustado
Erro padrão
Observações
0,998
0,995
0,994
1986,536
9
ANOVA
gl
Regressão
Resíduo
Total
Interseção
Área
Sacada
SQ
MQ
2 4,98E+09 2,49E+09
6 2,37E+07 3,95E+06
8 5,00E+09
Coeficientes
-79807,07
1881,11
21160,07
Erro
padrão
5195,15
52,98
1451,30
F
630,50
Stat t
valor-P
-15,36 4,81E-06
35,51 3,33E-08
14,58 6,53E-06
F de
significação
1,06E-07
95%
95%
inferiores superiores
-92519,2 -67095,0
1751,5
2010,7
17608,9
24711,3
Tabela 4.3.7
Pode-se observar que os coeficientes referentes as variáveis são positivos o que condizem
com a realidade de mercado. Percebe-se também que com a exclusão dos pontos
influenciantes e outliers do modelo, conseguiu-se uma melhora significativa no modelo de
regressão.
9º) Teste de hipótese nula da regressão
Pelo teste F, a mesma foi rejeitada ao nível de 1%, uma vez que:
F de sifnificaç ão  1,06E - 07  0,01 (O modelo é significativo)
10º) Teste de hipótese nula dos regressores
Testando as variáveis ao nível de 1%, tem-se:
Área - Valor P  3,33E - 08  0,01 (Significativa para o modelo)
Sacada - Valor P  6,53E - 06  0,01 (Significativa para o modelo)
11º) Determinação do valor de mercado do imóvel e intervalo de confiança
51
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
Como descrito no enunciado do exercício, o imóvel possui as seguintes características:
Área = 115m²
Sacada = Possui (Recebe valor 1 por se tratar de uma variável dicotômica)
Data
Confidence Level
80%
1
115
1
Área given value
Sacada given value
Predicted Y (YHat)
157680,9
For Average Predicted Y (Yhat)
Interval Half Width
2594,971
Confidence Interval Lower Limit
155086,00
Confidence Interval Upper Limit
160275,90
PÛ  1881,11 Área  21160,07  Sacada  79807,07
Substituindo os valores das variáveis independentes do imóvel avaliando, temos que o valor
previsto para o imóvel é:
PÛ = R$ 157680,90
Intervalo de confiança para o valor previsto:
R$ 155086,00 < PÛ < R$ 160275,90
A NBR 14653-2:2003 sugere a classificação da avaliação quanto ao Grau de Precisão (item
9.2.2). O nível de precisão é encontrado através do valor em porcentagem da amplitude do
intervalo de confiança de 80% sobre o valor pontual da avaliação.
AMPLITUDE 
PÛ sup  PÛ inf
PÛ

160275,90  155086,00
 0,033  3,3%
157680,90
Como a amplitude é menor do que 30% ,através da Tabela 1.7 podemos classificar a avaliação
com Grau de Precisão 3.
Obs: Fica a cargo do leitor realizar a verificação das hipóteses básicas do modelo.
5. Bibliografia
DANTAS, Rubens Alves (2005) Engenharia de avaliações: uma introdução a metodologia científica. 2.
ed. rev. de acordo com a NBR-14653-2:2004. São Paulo: PINI.
52
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
GUNST, Richard F., MASON, Robert L., Regression Analysis and its application: A data-Oriented
Approach. Nova York: MARCEL DEKKER, INC.
Levine, David M e outros (2005). Estatística – Teoria e aplicações usando o Microsoft Excel em
português. Trad. Eduardo Benedito Curtolo e Teresa Cristina Padilha de Souza. 3ª ed. Rio de Janeiro:
LTC.
NBR – 14653 – “Norma Brasileira para Avaliação de Bens”. ABNT.
Acedido em 18 de agosto de 2009, no Web site da: Universidade Federal de Santa Catarina:
http://www.inf.ufsc.br/~ogliari/arquivos/regressao_linear_multipla.ppt#33
Acedido em 21 de agosto de 2009, no Web site da: Universidade Federal do Pernambuco:
http://www.de.ufpe.br/~gjaa/Introreg.doc
Acedido em 27 de agosto de 2009, no Web site da: Universidade Federal do Pernambuco:
http://www.cin.ufpe.br/~rmcrs/ESAP/arquivos/RegressaoMultipla.pdf
6. Anexo 1
53
FUFMS - CCET –DEC - LADE
Avaliações e Perícias na Construção Civil
Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações
Prof. Wagner Augusto Andreasi, M. Engª.
Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009
.
(DANTAS, 2005, p. 238)
54