Introdução às Ferramentas de Análise Estatística do Excel 2007
Transcription
Introdução às Ferramentas de Análise Estatística do Excel 2007
UFMS - Universidade Federal de Mato Grosso do Sul CCET - Centro de Ciências Exatas e Tecnologia DEC - Departamento de Estruturas e Construção Civil Disciplina: Avaliações e Perícias na Construção Civil Professor Wagner Augusto Andreasi, M. Engº Acadêmico do Curso de Engª. Cvil: Ademir Aparecido Peixoto de Azevedo Atualizada pelo Acadêmico do Curso de Engª. Cvil Thiago Winter Macinelli em 2009 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 SUMÁRIO 1. Introdução......................................................................................................................3 2. Regressão Linear simples..............................................................................................3 2.1. Calculo das estatísticas de regressão e ANOVA..........................................3 2.2. Determinação do intervalo de confiança......................................................9 2.3. Teste de hipóteses........................................................................................11 2.4. Verificação das hipóteses básicas...............................................................13 3. Regressão Linear Múltipla..........................................................................................16 3.1. Considerações preliminares........................................................................16 3.2. Verificação da colinearidade entre variáveis independentes.....................18 3.3. Calculo das Estatísticas de Regressão e Anova..........................................21 3.4. Determinação do Intervalo de Confiança...................................................25 3.5. Teste de hipóteses........................................................................................27 3.6. Verificação das hipóteses básicas...............................................................28 4. Exemplos Resolvidos....................................................................................................28 5. Referências Bibliográficas...........................................................................................53 6. Anexo 1( Tabela de Durbin-Watson)..........................................................................54 2 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 1. Introdução Esta apostila tem o objetivo de apresentar ao leitor as ferramentas de Análise Estatística disponíveis no Microsoft Excel 2007 aplicadas a Engenharia de Avaliações, utilizando-as em exemplos de resolução de problemas de regressão linear simples e regressão linear múltipla. Pressupõe-se nesta apostila que o leitor já tenha conhecimentos teóricos básicos de estatística, tais como distribuições bilaterais e unilaterais, colinearidade, análise de resíduos, testes de significância, análise de variância e regressão linear. O objetivo maior desta apostila é diminuir o esforço e o tempo necessário para realizar uma avaliação utilizando o Microsoft Excel para realizar os cálculos, que são muito complexos e longos para serem feitos “a mão”. 2. Regressão Linear Simples 2.1. Calculo das Estatísticas de Regressão e Anova Consideremos o exemplo onde estamos interessados em avaliar um lote de 300 m 2 de área, situado a uma distância de cerca de 2.100 m de um ponto valorizante. Os atributos de diferenciação levantados compreendem a localização do lote, através da distância do mesmo em metros ao referido ponto e a área do lote. As características do imóvel avaliando bem como a dos imóveis da amostra estão apresentados na tabela abaixo: REGISTRO N.º 1 2 3 4 5 6 7 8 9 10 VARIÁVEL DEPENDENTE PREÇO UNITÁRIO (Y) 100,00 110,00 120,00 140,00 85,00 105,00 120,00 95,00 150,00 100,00 VARIÁVEIS INDEPENDENTES OU EXPLICATIVAS DIST. (X1) ÁREA (X2) 2.200,00 2.000,00 1.800,00 1.500,00 2.300,00 1.900,00 1.300,00 2.200,00 900,00 1.700,00 300,00 340,00 270,00 360,00 400,00 500,00 600,00 300,00 360,00 600,00 Tabela 1.1 Inicialmente poderíamos supor que o atributo distância ao ponto valorizante não seja influenciante no valor do lote e que a influência da área seja diretamente proporcional a esse valor, o que possibilitaria a resolução do problema por estatística descritiva. Entretanto, procuraremos levar em consideração o atributo distância ao ponto valorizante na formação dos preços, obtendo uma equação de regressão linear simples, relacionando o preço unitário (PU) com a distância (DIST) do tipo: Ŷi = B0 + B1X1, que terá o seguinte aspecto: 3 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 PÛ= B0+ B1 * DIST Para tanto, utilizaremos o Excel 2007 e o suplemento PHStat2 para calcular as Estatísticas de Regressão, Anova e Correlação. Ative o Excel e insira os dados em sua área de trabalho (Tabela 1.1), como mostrado na Figura 1.1. Figura 1.1 Antes de iniciar a Análise de Dados é necessário ativar os suplementos do Excel 2007 para que as ferramentas de análise estejam disponíveis, para ativá-las, clique com o botão direito sobre a barra de ferramentas, em seguida clique em “Personalizar barra de tarefas de acesso rápido” , clique em “Suplementos”, na opção Gerenciar, selecione a opção “Suplementos do Excel” e em seguida clique em “IR”, no menu suplementos ative os itens “Ferramentas de Análise” e “Ferramentas de Análise – VBA” , como mostrado na Figura 1.2, em seguida clique em “OK”. 4 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Figura 1.2 No menu Dados clique em “Análise de Dados”. Na caixa de diálogo Análise de Dados dê um duplo clique em “Regressão”. (Figura 1.3) Figura 1.3 5 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 No campo Intervalo Y de Entrada deve ser fornecido o intervalo que contém as variáveis dependentes ou explicadas, que em nosso caso é PU. Selecione a célula B1 e arraste até a célula B11. Clique no campo Intervalo X de Entrada. Da mesma forma, para este campo, deve ser fornecido o intervalo que contém as variáveis independentes ou explicativas, que em nosso caso é a distância. Portanto, selecione a célula C1 e arraste até a célula C11 para selecionar o intervalo. Marque a opção Rótulos, pois em nossos intervalos incluímos junto aos dados seus respectivos rótulos. Marque a opção Nível de Confiança e substitua o valor padrão de 95% por 80% que é o valor recomendado pela NBR-14653-2:2003. Marque as opções “Resíduos”, “Resíduos Padronizados” e “Plotar Resíduos”. Figura 1.4 Clique no botão Intervalo de saída e, posteriormente, no campo que está a sua direita. Insira a referência para a célula onde o Microsoft Excel exibirá o canto superior esquerdo da tabela de regressão e Anova. Para tanto, após selecionar o referido campo clique sobre a célula A19 ou referencie a célula A19 digitando “A19” diretamente no campo. A aparência da caixa de diálogo Regressão ficará semelhante com a da Figura 1.4 mostrada acima. Clique em OK. 6 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 O Excel fornecerá as Estatísticas de Regressão, Anova e Tabela de Resíduos. Figura 1.5 Registro nº Variável Dependente (PU) 1 100,00 2 110,00 3 120,00 4 140,00 5 85,00 6 105,00 7 120,00 8 95,00 9 150,00 10 100,00 DIST. (X1) 2.200,00 2.000,00 1.800,00 1.500,00 2.300,00 1.900,00 1.300,00 2.200,00 900,00 1.700,00 ÁREA (X2) 300 340 270 360 400 500 600 300 360 600 Tabela 1.2 Antes de fazer a inferência estatística é necessário conhecer o significado dos parâmetros fornecido pelo Excel: 7 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,88054 R-Quadrado 0,77536 R-quadrado ajustado 0,74728 Erro padrão 10,21017 Observações 10 Tabela 1.3 R-múltiplo: Correlação entre as variáveis independentes e a variável dependente. R-quadrado: Poder de explicação do modelo de regressão, no exemplo 77,5% da variabilidade dos preços é explicado pelo modelo adotado R-quadrado ajustado: Idem ao R-quadrado, porém ajustado levanto em conta o numero de variáveis independentes Erro padrão: É o desvio padrão do modelo, dado pela raiz quadrada da variância. ANOVA gl Regressão Resíduo Total 1 8 9 SQ 2878,51914 833,98085 3712,5 Interseção DIST. (X1) Coeficientes 184,16104 -0,040259 Erro padrão 14,01440 0,00766 Inferior 80,0% MQ F 2878,51914 27,61233 104,24760 F de significação 0,00077 Stat t valor-P 95% inferiores 13,14084 1,07E-06 151,84380 -5,25474 0,00077 -0,05793 95% superiores 216,47830 -0,02259 Superior 80,0% 164,58550 203,73660 -0,05096 -0,02956 Tabela 1.4 8 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 RESULTADOS DE RESÍDUOS Observação 1 2 3 4 5 6 7 8 9 10 Previsto(a) PREÇO UNITÁRIO (Y) 95,59121 103,64301 111,69481 123,77252 91,56531 107,66891 131,82432 95,59121 147,92792 115,72072 Resíduos 4,40878 6,35698 8,30518 16,22747 -6,56531 -2,66891 -11,82432 -0,59121 2,07207 -15,72072 Resíduos padrão 0,45799 0,66038 0,86276 1,68575 -0,68202 -0,27725 -1,22834 -0,06141 0,21525 -1,63311 Tabela 1.5 Agora de posse dos coeficientes da equação de regressão linear simples, podemos concluir que a equação PÛ = B0 + B1 * DIST, fazendo as devidas substituições com os coeficientes, é: PÛ = 184,161 – 0,04026*DIST, Que para DIST = 2.100 m resulta: PÛ = R$ 99,62 / m2 2.2. Determinação do Intervalo de Confiança: Para o cálculo do Intevalo de confiança utilizaremos o “PHStat2”. O software será disponibilizado pelo professor no inicio do curso, ou pode-se fazer o download a partir do site http://www.dec.ufms.br/lade. ALTERAR Após instalado o “PHStat” só estará disponível no Excel quando ele for aberto, portanto, toda vez que forem utilizar o “PHStat” deve-se abrir o “Excel” e o “PHStat”. O leitor saberá se o software esta disponivel verficando se esta aparecendo o menu “Suplementos” na barra de ferramentas. No caso de o menu “Suplementos” não estar aparecendo, a instalação pode ter sido feita de forma incorreta, ou o usuário não abriu o “PHStat” Na barra de ferramentas abra o menu “Suplementos”, clique em “PHStat”, clique em “Regression” e clique em “Simple Linear Regression” Configure o PHStat conforme mostrado na figura 1.6, onde X é o valor da variável independente para o terreno que esta sendo avaliado, no caso X é a distancia 2100 metros. Clique em OK, o PHStat criará um nova planilha com nome “Estimated” com os intervalos de confiança para o preço previsto e para uma nova observação. 9 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Fig 1.6 For Average Predicted Y (YHat) Interval Half Width 5,662778 Confidence Interval Lower Limit 93,95434 Confidence Interval Upper Limit 105,2799 For Individual Response Y Interval Half Width 15,34483 Prediction Interval Lower Limit 84,27229 Prediction Interval Upper Limit 114,9619 Tabela 1.6 Intervalo de confiança para o valor previsto: R$ 93,954 < PÛ < R$ 105,279 A NBR 14653-2:2003 sugere a classificação da avaliação quanto ao Grau de Precisão (item 9.2.2). O nível de precisão é encontrado através do valor em porcentagem da amplitude do 10 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 intervalo de confiança de 80% sobre o valor pontual da avaliação. Como fornecemos para o campo “confidence levels for interval estimates” o valor de 80%, os valor superior e inferior fornecidos pelo PHStat referem-se a um intervalo de confiança de 80% sobre o valor pontual da avaliação, com estes dados pode-se calcular a amplitude que é dada por: AMPLITUDE PÛ sup PÛ inf PÛ 105,279 93,954 0,114 11,4% 99,62 III Grau II I ≤ 30% 30% - 50% > 50% Descrição Amplitude do intervalo de confiança de 80% em torno do valor central da estimativa NOTA Observar subseção 9.1. Tabela 1.7 Através da Tabela 1.7, que foi transcrita da NBR 14653-2, pode-se classificar a avaliação quanto ao grau de precisão, como a amplitude do intervalo de confiança é menor do que 30% , a avaliação apresenta Grau de Precisão 3 O intervalo para uma resposta individual de Y, é o intervalo de confiança para uma nova observação que possua as mesmas caracteristicas quanto as variáveis da observação utilizada para o cálculo, não é de interesse para a avaliação pois o que nos interessa é o intervalo de confiança para a observação que foi avaliada. 2.3. Teste de hipóteses Testada a hipótese nula da regressão (ß1 = 0) pelo teste F, a mesma foi rejeitada ao nível de 1%, uma vez que: Fcalculado = 27,61 > F (λ) (k), (n-k-1) = F (1%) (1), (8) = 11,30. (Fcalculado está localizado na célula E30 da tabela do Excel). Nota: Para obter F (1%) (1), (8) pode-se consultar uma tabela F ou através da função “INVF” do Excel, para a obtenção através da função “INVF” deve-se proceder da seguinte forma: Escolha uma célula vazia do Excel e digite a expressão a seguir: =INVF(“prob”; “k”; “n-k-1”) , onde: -“prob”: é o nível de significância desejado, em nosso caso 1% -“k”: é o numero de variáveis do modelo, em nosso caso é 1 -“n” é o numero de amostras do modelo, em nosso caso é 10 11 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Substituindo os dados, a fórmula ficará como a mostrada a seguir: =INVF(0,01;1;8) Pressione ENTER, e o Excel fornecerá o valor de F (1%) (1), (8) Na célula E31 o Excel fornece o F de significação, que é o nível de significância com o qual se aceita a hipótese nula da regressão, no modelo como F de significação < 0,01, rejeita-se a hipótese nula da regressão ao nível de 1%. Testada a hipótese nula do regressor (ß1 =0), a mesma foi rejeitada ao nível de 5%, uma vez que: t1 B1 0,04026 5,25 t ( n2), t (8), 5% 2,31 S B1 0,007661 Nota: Para obter t(8), 5% pode-se consultar uma tabela t ou através da função “INVT” do Excel, para a obtenção através da função “INVT” deve-se proceder da seguinte forma: Escolha uma célula vazia do Excel e digite a expressão a seguir: =INVT(“prob”; “n-k-1”) , onde: -“prob”: é o nível de significância desejado, em nosso caso 5% -“k”: é o numero de variáveis do modelo, em nosso caso é 1 -“n” é o numero de amostras do modelo, em nosso caso é 10 Substituindo os dados, a fórmula ficará como a mostrada a seguir: =INVT(0,05;8) Pressione ENTER, e o Excel fornecerá o valor de t(8), 5% Outra forma de fazer o teste é através do valor P (Célula E36) que representa o nível de significância com a qual se aceita a hipótese nula do regressor, no modelo, como valor P < 0,05, rejeita-se a hipótese nula do regressor ao nível de 5%. Obs.: Os níveis de significância adotados para o teste de hipóteses devem ser escolhidos através da NBR 14653, item 9.2.1. Os níveis de significância dependem do Grau de Fundamentação escolhido pelo avaliador. 2.4. Verificação das hipóteses básicas 12 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Primeira hipótese: A variável independente corresponde a números reais que não contenham nenhuma perturbação aleatória. De fato, no caso de dados imobiliários, as variáveis independentes estão relacionados com as características fixas de cada elemento tomado com referência, estando a hipótese atendida. Segunda hipótese: O número de observações, n, deve ser superior ao número de parâmetros estimados pelo modelo. Para evitar o problema de micro numerosidade, a NBR 14653-2 no item 3 da Tabela 1 determina o número mínimo dados de mercado utilizados na modelagem, a princípio: n 3(k 1) , onde k é o numero de variáveis independentes. Terceira hipótese: Os erros são variáveis aleatórias com valor esperado nulo e variância constante. Um gráfico de resíduos versus valores previsto, apresentando pontos distribuídos aleatoriamente em torno de uma reta que passa na origem sem nenhum padrão definido, é um indicador favorável a verificação da hipótese. Construa um gráfico com os “valores previstos” (Células B43:B52) da tabela de resíduos no eixo das abscissas e com os “resíduos” (Células C43:C52) no eixo das ordenadas O gráfico deverá ficar igual ao apresentado abaixo: Gráfico 1.1 13 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Como os pontos estão distribuídos de forma aleatória em torno da reta horizontal que passa pela origem e não apresentam nenhum padrão definido, aceita-se a hipótese como atendida, classificase também o modelo como homocedástico1. Quarta hipótese: Os erros são variáveis aleatórias com distribuição normal. Um gráfico de resíduos padronizados versus preço previsto, apresentando 95% dos pontos no intervalo [-1,96;+1,96] é um indicador favorável a verificação da hipótese. Construa um gráfico com os “valores previstos” (Células B43:B52) da tabela de resíduos no eixo das abscissas e “resíduos padronizados” (Células D43:D52) no eixo das ordenadas. O gráfico deverá ficar igual ao apresentado abaixo: Tabela 1.2 Como 100% dos pontos estão distribuídos no intervalo [-1,96;+1,96] se aceita a quarta hipótese. Quinta hipótese: Os erros são “não correlacionados”, isto é, são independentes sob a condição de normalidade. A verificação é feita com o auxilio da razão de Von Neumann, que foi tabelada por Durbin Watson para os níveis de significância de 5%, 2,5% e 1%, considerando modelos com 15 a 100 observações com até seis variáveis (Ver Anexo 1). A estatística de Von Neumann pode ser calculada através do PHStat.. Na barra de ferramentas abra o menu “Suplementos”, clique em “PHStat”, clique em “Regression” e clique em “Simple Linear Regression”. Informe o intervalo de células das variáveis dependentes e independentes, e selecione a opção “Durbin-Watson Statistic”, em seguida clique em “OK”, o 1 Homocedástico: Quando os pontos apresentam dispersão totalmente aleatória em torno de uma reta horizontal que passa pela origem e sem nenhum padrão definido. 14 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 menu deverá ficar como o apresentado na Figura 1.7. O PHStat criará uma nova planilha com o valor da Razão de Von Neumann (Durbin-Watson Statistic). Figura 1.7 Durbin-Watson Calculations Sum of Squared Difference of Residuals Sum of Squared Residuals 1138,727801 833,9808559 Durbin-Watson Statistic 1,365412399 Tabela 1.8 Para que a quinta hipótese seja satisfeita: du < Durbin-Watson Statistic < (4 - du), onde du é o valor tabelado por Durbin-Watson (ver Anexo 1) . Escolhe-se o valor de du para 15 observações (du não foi tabelado para 10 observações) e 1 variável independente ao nível de significância de 1%. dutab 1,07 15 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Como: 1,07 < Durbin-Watson Statistic < (4 -1,07) 1,07 < 1,37 < 2,93 Aceita-se a quinta hipótese. Desta forma podemos concluir que a equação encontrada para a regressão PÛ = 184,161 – 0,04026*DIST, é válida para inferência do valor do preço unitário, quando a distância do terreno ao ponto valorizante for igual a 2100 m. Obs. Neste exemplo assim como no seguinte, estamos supondo a amostra já saneada, isto é, isenta de dados supostamente discrepantes. Mais tarde será ilustrado como proceder para sanear uma amostra utilizando o critério de Chauvenet. 3. Regressão Linear Múltipla 3.1. Considerações preliminares É recomendado ao leitor que só inicie a leitura deste capitulo após ter lido o capitulo que trata de regressão linear simples, pois é necessário o total conhecimento de regressão linear simples para proceder a analise de regressão múltipla. Para aplicação da metodologia, será apresentada a avaliação do valor de aluguel de um apartamento, no exemplo foram escolhidas varias variáveis independentes e o objetivo é selecionar quais variáveis explicam melhor a variação do valor de mercado do aluguel do imóvel. Os atributos de diferenciação levantados compreendem: -Variáveis quantitativas - Número de quartos - Número de banheiros - Número de vagas de garagem. Variáveis dicotômicas: -Área de lazer (Recebe valor 1 se o apartamento possuir, e 0 em caso contrário) Variáveis qualitativas: -Estado de conservação (Recebe valor 1 para bom, 2 para regular e 3 para ruim), é considerada como qualitativa, mas na verdade é uma variável tricotômica. É de grande importância o avaliador verificar após a regressão se os coeficientes encontrados para cada variável condiz com a realidade conforme o exemplo: Ex: O coeficiente de uma variável com valor da área não pode ser negativo, pois sabe-se que quanto maior a área do imóvel maior seu valor. O imóvel avaliando possui as seguintes características: - Numero de quartos: 3 16 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 -Numero de banheiros: 2 - Numero de vagas de garagem: 1 -Área de lazer: Não possui (Recebe valor 0) -Estado de conservação: Regular (Recebe valor 2) Desta forma, tentar-se-á obter uma equação de regressão múltipla relacionando o preço unitário (PU) com as variáveis descritas anteriormente. A equação será do tipo: PUi = Bo + B1X1 + B2X2 + ....+ BnXn Os dados coletados do mercado para a avaliação são os descritos na tabela abaixo: N. de registro Preço 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 450 400 500 500 350 600 350 300 450 350 500 500 500 350 400 300 500 450 400 480 420 Numero de Número de quartos banheiros (X1) (X2) 3 3 3 3 2 3 2 2 2 2 3 3 3 2 2 2 3 2 2 3 3 2 1 2 2 1 2 1 1 1 1 2 2 2 1 1 1 2 1 1 2 2 Vagas de garagem (X3) 1 1 1 2 1 2 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 Estado de Área de conservação lazer (X5) (X4) 2 3 2 3 2 1 2 2 1 2 2 2 2 2 2 2 2 1 2 3 3 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 Tabela 2.1 Na regressão múltipla deve-se atentar a correlação entre variáveis independentes, que se for alta pode prejudicar a estimativa dos parâmetros do modelo, gerando um modelo tendencioso que não explica de fato o comportamento dos valores de mercado. 17 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 3.2. Verificação da colinearidade entre variáveis independentes Inicialmente será verificado a correlação entre as variáveis utilizando a tabela de correlação do Excel e o fator inflacionário de variância (FIV) obtido através do PHStat. A tabela de correlação fornece a correlação das variáveis uma a uma, enquanto o FIV fornece a correlação de uma variável com todas as outras variáveis do modelo. O FIV é dado por: 1 , onde: FIV 2 1 rj r j - Correlação entre uma variável independente com as variáveis independentes restantes. Portanto quando r j =0,9, o FIV é aproximadamente 5. Alguns autores consideram como valor critico para o FIV o valor 5, outros consideram crítico o valor 10, nesta apostila consideraremos como valor crítico o FIV igual a 5 (LEVINE et al, 2005). No menu Dados clique em Análise de Dados. Na caixa de diálogo Análise de Dados dê um duplo clique em Regressão. Com o Excel ativo, e com os dados já dispostos em sua área de trabalho (Tabela 2.1), no menu Dados clique em “Análise de Dados”. Figura 2.1 Na caixa de diálogo Análise de Dados escolha “Correlação” e clique em “OK”. 18 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 No campo Intervalo de Entrada deve ser fornecido o intervalo que contêm todas as variáveis envolvidas na regressão, que neste exemplo são seis: PU, X1, X2, X3, X4 e X5. Portanto, selecione B1 e arraste até G22. Marque a opção Rótulos na primeira linha, pois em nossa seleção incluímos com os dados seus respectivos rótulos. Marque em Opções de saída o botão Intervalo de saída. Para inserir a referência para a célula superior esquerda da tabela de saída, clique no campo que está imediatamente à direita do botão intervalo de saída e insira a referência de célula “A24”. Clique em OK. O resultado será uma tabela de Correlação como a mostrada na Figura 2.2: Figura 2.2 De posse das Correlações entre os dados, deve-se verificar se há alguma correlação superior a 0,70 entre variáveis independentes. Segundo Dantas (2005) correlações acima de 0,7 podem ser prejudiciais ao modelo. No exemplo, as variáveis “número de banheiros” e “numero de quartos” apresentam correlação igual a 0,90, o que é prejudicial ao modelo, uma das duas variáveis deve ser excluída do modelo. Para determinar qual variável a ser excluída será calculado o FIV através do PHStat. Para o cálculo do FIV utilizaremos o PHStat2. Na barra de ferramentas abra o menu “Suplementos”, clique em “PHStat”, clique em “Regression” e clique em “Multiple Regression” Configure o PHStat conforme mostrado na Figura 2.3, selecione a opção “Variance inflationary factor (VIF)” e clique em “OK” 19 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 O PHStat criará varias planihas contendo o FIV de cada variável, deve-se verificar se existe alguma variavel com FIV maior que 5, caso exista, deve-se excluir a variavel. Caso exista 2 variáveis com FIV maior que 5 deve-se excluir a variavel com maior FIV e após proceder uma nova verificação do FIV até que não haja nenhuma variável com FIV maior que 5. Figura 2.3 Os FIVs calculados são: -Numero de quartos: FIV = 10,119 -Numero de banheiros: FIV = 7,448 -Vagas de garagem: FIV = 1,532 -Estado de conservação: FIV = 1,385 -Área de lazer: FIV = 1,893 As variaveis “número de quartos” e “numero de banheiros” possuem FIV maior que 5, porém o FIV da variavel numero de quartos é maior, deve-se excluir a variavel „numero de quartos” e fazer nova verficação do FIV. Após a exclusão da variável numero de quartos a planilha deve ficar como a Tabela 2.2: 20 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 N. de registro Preço Número de banheiros (X1) Vagas de garagem (X2) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 450 400 500 500 350 600 350 300 450 350 500 500 500 350 400 300 500 450 400 480 420 2 1 2 2 1 2 1 1 1 1 2 2 2 1 1 1 2 1 1 2 2 1 1 1 2 1 2 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 Estado de Área de conservação lazer (X4) (X3) 2 3 2 3 2 1 2 2 1 2 2 2 2 2 2 2 2 1 2 3 3 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 Tabela 2.2 Após refazer os cálculos do FIV, devem-se obter os seguintes resultados: -Numero de banheiros: FIV = 1,495 -Vagas de garagem: FIV = 1,407 -Estado de conservação: FIV = 1,207 -Área de lazer: FIV = 1,358 Como todos os FIVs são menores que 5 não há problema de colinearidade no modelo com 4 variáveis independentes. 3.3. Calculo das Estatísticas de Regressão e Anova No menu “Dados” clique em “Análise de Dados”. Na caixa de diálogo Análise de Dados escolha “Regressão” e clique em “OK”. O Excel exibirá a caixa de diálogo Regressão. No campo Intervalo Y de entrada, vamos inserir as referências de células que contém os dados da variável dependente, que neste exemplo é Preço. Clique em B1 e arraste o mouse até B22. 21 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 No campo Intervalo X de entrada, vamos inserir as referências de células que contém os dados das variáveis dependentes, que neste exemplo são X1, X2, X3 e X4. Clique no campo Intervalo X de entrada. Selecione a célula C1 e arraste o mouse até a célula F22, a referência de célula aparecerá automaticamente no referido campo. Como na referência dos dados dependentes e independentes, nos referimos aos dados com seus respectivos rótulos, marque a opção Rótulos. Dado que estamos trabalhando com um intervalo de confiança de 80% marque o botão Intervalo de confiança e substitua o valor padrão de 95% por 80%. Em Opções de saída marque o botão Intervalo de saída para introduzir uma referência de célula. Selecione as opções: Resíduos, Resíduos Padronizados e Plotar Resíduos Clique no campo à direita do botão. Selecione a célula A31. A configuração da caixa de diálogo Regressão se parecerá como a mostrada na Figura 2.4. Clique em OK. Figura 2.4 O resultado será a tabela de regressão como mostrada na Figura 2.5: 22 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Figura 2.5 As tabelas de Regressão, Anova, Resíduos e Correlação gerada pelo Microsoft Excel estão apresentadas abaixo: RESUMO DOS RESULTADOS Estatística de regressão R múltiplo R-Quadrado R-quadrado ajustado Erro padrão Observações 0,91573 0,83856 0,79821 35,39676 21 ANOVA gl Regressão Resíduo Total 4 16 20 SQ MQ 104134,06220 26033,51554 20046,89023 1252,93064 124180,95240 F 20,77810 F de significação 3,55556E-06 23 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Coeficientes Erro padrão Stat t valor-P 95% inferiores 95% superiores Interseção Número de banheiros (X1) Vagas de garagem (X2) Estado de conservação (X3) 302,88334 39,27305 7,71224 8,89007E-07 219,62820 386,13849 108,66723 18,91222 5,74587 3,00723E-05 68,57510 148,75937 61,80280 26,18965 2,35982 0,031321044 6,28322 117,32238 -55,24505 14,75194 -3,74493 0,001766555 -86,51778 -23,97232 Área de lazer (X4) 53,25881 22,92891 2,32278 0,033699697 4,65167 101,86595 Inferior 80,0% 250,38482 83,38618 26,79360 -74,96482 22,60841 Superior 80,0% 355,38187 133,94829 96,81201 -35,52528 83,90921 RESULTADOS DE RESÍDUOS Observação Previsto(a) Preço 1 471,53 2 360,87 3 524,78 4 478,08 5 362,86 6 588,57 7 362,86 8 362,86 9 418,11 10 362,86 11 471,53 12 471,53 13 533,33 14 362,86 15 362,86 16 362,86 17 524,78 18 418,10 19 362,86 20 469,54 21 416,29 Resíduos -21,53052 39,12295 -24,78933 21,91172 -12,86328 11,42161 -12,86328 -62,86328 31,89165 -12,86328 28,46947 28,46947 -33,33333 -12,86328 37,13671 -62,86328 -24,78933 31,89165 37,13671 10,45571 3,71453 Resíduos padrão -0,68005 1,23572 -0,78299 0,69209 -0,40629 0,36076 -0,40629 -1,98558 1,00732 -0,40629 0,89923 0,89923 -1,05285 -0,40629 1,17299 -1,98558 -0,78299 1,00732 1,17299 0,33025 0,11732 24 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Através das estatísticas de regressão e da tabela Anova, obtivemos a seguinte equação de regressão: PÛ 302,88 108,66 X 1 61,80 X 2 55,25 X 3 53,26 X 4 Substituindo os valores das variáveis independentes do imóvel avaliando: -Numero de banheiros (X1): 2 - Numero de vagas de garagem (X2): 1 -Estado de conservação (X3): 2 -Área de lazer (X4): 0 Temos que o valor previsto para o aluguel do imóvel é: PÛ = R$ 471,53 3.4. Determinação do Intervalo de Confiança Para o cálculo do Intevalo de confiança utilizaremos o PHStat2. Na barra de ferramentas abra o menu “Suplementos”, clique em “PHStat”, clique em “Regression” e clique em “Multiple Regression” Configure o PHStat conforme mostrado na figura 2.6. Clique em OK, o PHStat criará um nova planilha com nome “Intervals” com os intervalos de confiança para o preço previsto e para uma nova observação. Nas células B6:B9 deve-se informar os valores das variáveis independentes do imóvel avaliando. Para o imóvel avaliando desta apostila devem-se preencher os campos como segue descrito na tabela 2.3: Data Confidence Level Número de banheiros (X1) given value Vagas de garagem (X2) given value Estado de conservação (X3) given value Área de lazer (X4) given value 80% 1 2 1 2 0 Tabela 2.3 25 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Figura 2.6 Nas células A29:B39, o PHStat fornece o valor previsto para o imóvel e os intervalos de confiança para o valor previsto e para uma resposta individual, conforme abaixo. Predicted Y (YHat) 471,53 For Average Predicted Y (Yhat) Interval Half Width Confidence Interval Lower Limit Confidence Interval Upper Limit 21,89 449,64 493,42 For Individual Response Y Interval Half Width Prediction Interval Lower Limit Prediction Interval Upper Limit 52,13 419,39 523,67 Tabela 2.4 Intervalo de confiança para o valor previsto: R$ 449,64 < PÛ < R$ 493,43 26 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 A NBR 14653-2:2003 sugere a classificação da avaliação quanto ao Grau de Precisão (item 9.2.2). O nível de precisão é encontrado através do valor em porcentagem da amplitude do intervalo de confiança de 80% sobre o valor pontual da avaliação. AMPLITUDE PÛ sup PÛ inf PÛ 493,43 449,64 0,093 9,3 % 471,53 Como a amplitude é menor do que 30% ,através da Tabela 1.7 podemos classificar a avaliação com Grau de Precisão 3 O intervalo para uma resposta individual de Y não é de interesse para a avaliação (Ver item 2.2 desta apostila). 3.5. Teste de hipóteses Testada a hipótese nula da regressão (ß1 = 0) pelo teste F, a mesma foi rejeitada ao nível de 1%, uma vez que: F de sifnificaç ão 3,55 10 6 0,01 ( F de significaç ão está localizado na célula F42 da tabela do Excel) OBS: F de significação é o nível de significância em que se aceita a hipótese nula da regressão. Caso fosse aceita a hipótese nula da regressão a equação obtida não poderia ser utilizada para explicar o comportamento dos valores de mercado dos imóveis. Testada a hipótese nula dos regressores (ß1 =0), a mesma foi rejeitada ao nível de 5%, uma vez que: Valor P ( X 1) 3,01 10 5 0,05 Valor P ( X 2) 0,031 0,05 Valor P ( X 3) 0,001 0,05 Valor P ( X 4) 0,034 0,05 (Valor P das variáveis está localizado nas células E47:E51) OBS: Valor P é o nível de significância em que se aceita a hipótese nula dos regressores. Caso alguma variável independente tivesse a hipótese nula aceita, ela poderia ser excluída do modelo, e dever-se-ia recalcular as estatísticas de regressão, tabela Anova, e tabela de resíduos. 27 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 3.6. Verificação das hipóteses básicas Deve-se proceder a verificação das 5 hipóteses básicas descritas na Regressão Linear Simples e verificar uma nova hipótese que só se aplica a Regressão Múltipla. Sexta hipótese: Não deve existir nenhuma relação exata entre quaisquer variáveis independentes. Para proceder esta verificação deve-se consultar a tabela de correlações e assegurar que não exista nenhuma correlação igual a 1 entre duas variáveis independentes. TABELA DE CORRELAÇÃO Preço Preço Número de banheiros Vagas de garagem Estado de conservação Área de lazer 1 0,794124877 0,543532721 -0,14093509 0,246310115 Número de banheiros Vagas de garagem Estado de conservação 1 0,428174419 1 0,252509201 -0,03378687 1 0,265935942 -0,19802951 0,381375432 Área de lazer 1 No modelo não existe nenhum correlação igual a 1 entre duas variáveis independentes, então, se aceita a sexta hipótese. Obs. Neste exemplo, estamos supondo a amostra já saneada, isto é, isenta de dados supostamente discrepantes. Mais tarde será ilustrado como proceder para sanear uma amostra utilizando o critério de Chauvenet. 4. Exemplos Resolvidos 4.1. Um corretor de imóveis quer saber se em determinado bairro da cidade (representado pela amostra abaixo - tab. 3.1) se a dimensão da frente de um terreno ou sua testada, influi ou não na formação de preços unitários (R$/m2). Esse é um problema típico que pela aplicação de inferência estatística, podemos afirmar se a dimensão da frente dos terrenos influi ou não na formação de seus preços unitários. Amostra 1 2 3 4 5 6 Frente (m) Profund. (m) 15,00 31,50 15,00 30,00 15,00 37,65 12,00 30,00 15,00 30,00 12,00 30,00 Planilha 4.1.1 R$/m2 31,75 44,44 31,87 38,85 51,11 36,11 28 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Resolução: 1º) Saneamento da amostra (Critério de Chauvenet) Consiste em se eliminar os registros da amostra, cujos preços (Pori) distem mais do que um certo limite (dlim) da média de preços da amostra, ou seja, elimina-se todos os registros cujos preços (Pori) estiverem fora do intervalo: (Pori - dlim) ≤ Pori (i) ≤ (Pori + dlim) Com dlim = Sp x (d/Sp)crítico, onde: n Sp ( Pori(i) Pori) 2 i 1 n 1 Sp é o desvio padrão dos preços da amostra, dado por: e (d/Sp)crítico uma função da quantidade de registros da amostra, conforme a seguir: 5 n= (d/Sp)crítico 1,65 6 1,73 7 1,80 8 1,86 9 1,92 10 1,96 11 n= (d/Sp)crítico 1,98 12 2,03 13 2,05 14 2,10 15 2,12 16 2,16 17 n= (d/Sp)crítico 2,18 18 2,20 19 2,23 20 2,24 21 2,26 22 2,28 24 n= (d/Sp)crítico 2,31 26 2,35 30 40 2,39 2,50 Tabela 4.1.2 50 2,58 Com a tabela 3.1 inserida no Microsoft Excel, utilize as funções MÉDIA e DESVPAD para calcular Pori que é a média aritmética dos preços unitários (R$/m2) e Sp que é o desvio padrão dos preços da amostra. Daí, vem que: Sp = 7,59 e Pori = 39,02, n = 6 e dlim = 7,59*1,73 = 13,13, de modo que o intervalo: (Pori - dlim) ≤ Pori (i) ≤ (Pori + dlim) é igual a: (39,02 – 13,13) ≤ Pori (i) ≤ (39,02 + 13,13) = 25,89 ≤ Pori (i) ≤ 52,15 29 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Com isto, concluímos que a amostra não tem nenhum dado supostamente discrepante. Isto é, a amostra já está saneada. 2º) Cálculo das Correlações, Regressores e Anova. Correlações: Frente (m) Frente (m) Profund. (m) R$/m2 Profund. (m) R$/m2 1 0,38602956 1 0,15734108 -0,56507026 Estatística de regressão R múltiplo 0,69640049 R-Quadrado 0,48497365 R-quadrado 0,14162275 ajustado Erro padrão 7,03174433 Observações 6 ANOVA gl Regressão 2 Resíduo 3 Total 5 Coeficientes Interseção 66,2600311 Frente (m) 2,16161984 Profund. (m) -1,8239823 95% Inferior 80,0% superiores 183,4225108 5,9661244 9,164455972 -1,44216483 1,721331482 -3,64846416 1 SQ 139,680598 148,336285 288,016883 Erro padrão 36,8151914 2,2004549 1,11402051 Superior 80,0% 126,5539377 5,765404507 0,000499551 MQ F F de significação 69,8402992 1,4124723 0,369610395 49,4454283 Stat t Valor-P 1,79980135 0,1697137 0,98235135 0,3983645 -1,63729688 0,2000917 95% inferiores -50,90244869 -4,84121629 -5,369296092 Tabela 4.1.3 3º) Teste de hipótese nula da regressão (ß1 = 0 e ß2 = 0) Testada a hipótese nula da regressão (ß1 = 0 e ß2 = 0), ambas foram aceitas, uma vez que: Fcalculado= 1,4124723 < F (λ) (k), (n-k-1) = F (1%) (2), (3) = 30,81 (tabelado) Isto significa que ß1 e ß2 não são variáveis influenciantes ao nível de significância de 1% ou sua influência é muito reduzida na formação do preço unitário dos terrenos. Como a hipótese nula do teste foi aceita, poderíamos concluir nossa análise nesta etapa. Mas para ilustrar o roteiro normalmente adotado quando a hipótese nula é rejeitada, vamos continuar os testes. 30 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 4º) Teste de hipótese nula dos regressores (ß1 = 0 ou ß2 = 0) Testada a hipótese nula dos regressores (ß1 = 0 ou ß2 = 0), a primeira foi aceita, uma vez : t1 b1 QMR 2,16161984 SQ x1 .SQ x 2 ( S x1x 2 ) 2 SQ x 2 49,44 2,161 0,982 2,200 12 * 46,82 (9,15) 2 46,82 |t1| = 0,982 < t (n-k-1), = t (3),5% = 2,3534 Isto significa que ß1 não influi decisivamente e suficientemente na formação de preços para ser incluído na equação de regressão. Isto é, a equação que melhor representa a formação de preços dos terrenos desta amostra, é uma equação que não envolve a variável frente do terreno. t2 b2 QMR SQ x1 .SQ x 2 ( S x1x 2 ) 2 SQ x1 1,823 49,44 1,823 1,636 1,114 12 * 46,82 (9,15) 2 12,00 |t2| = 1,636 < t (n-k-1), = t (3),5% = 2,3534 Assim temos também que ß2 não influi decisivamente na formação de preços, com um nível de confiança de 90%, para fazer parte da equação que procura descrever a variação de preços no mercado imobiliário da região de coleta das amostras. Deste modo, não podemos obter, a partir dos dados da tab. 3.1, uma equação que represente o preço unitário dos terrenos de forma eficiente. Como esperávamos, este teste apenas confirmou o que já havíamos concluído no 4.º passo: Entretanto, como a amostra é muito pequena, pode acontecer desta não ser representativa, isto é, corre-se o risco de ser tendenciosa. Daí deveríamos suspeitar que a amostra não é de fato representativa, tendo em vista que a bibliografia técnica afirma que a frente ou testada do terreno influi decisivamente na formação de seu preço unitário. 4.2. A tabela a seguir se refere a uma pesquisa de terrenos urbanos em uma dada área central de uma cidade X. A pesquisa concentrou-se ao longo das Avenidas AP e PF, duas vias de comércio intenso e nas ruas transversais até uma distância máxima de 270m. Registrou-se os preços dos terrenos em oferta, suas áreas e distância às referidas avenidas. Verifique se pode ou não obter uma equação de regressão a partir da amostra abaixo. 31 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Registro n.º VT 1 170000 2 100000 3 150000 4 180000 5 1080000 6 700000 7 50000 8 20000 9 55000 10 18000 ÁREA 422 360 2055 901 7200 8057 430 280 360 200 DIST. 0 0 110 40 70 270 40 40 40 40 (esquina) (esquina) (esquina) (esquina) Planilha 4.2.1 Resolução: 1º) Saneamento da amostra (Critério de Chauvenet) (Pori – dlim) ≤ Pori (i) ≤ (Pori + dlim) Como: dlim = Sp x (d/Sp)crítico Sp = 352750,5, Pori = 252300, n =10 e (d/Sp)crítico = 1,96 dlim = 352750,5 * 1,96 = 691390,94 (Pori – dlim) ≤ Pori (i) ≤ (Pori + dlim) 252300 – 691390,94 ≤ Pori (i) ≤ 252300 + 691390,94 -439090,94 ≤ Pori (i) ≤ 943690,94 Como o registro n.º 5 está fora do intervalo acima, concluímos que se trata de um dado espúrio, portanto, será eliminado e não considerado para fins de inferência estatística. Vamos recalcular novamente o intervalo para o critério de Chauvenet para verificar se existe mais algum dado discrepante. Sp = 211745,13, Pori = 160333,33, n = 9 e (d/Sp)crítico = 1,92 dlim = 211745,13*1.92 = 406550,65 (Pori – dlim) ≤ Pori (i) ≤ (Pori + dlim) 160333,33 – 406550,65 ≤ Pori (i) ≤ 160333,33 + 406550.65 -246217 ≤ Pori (i) 566883,98 32 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Desta forma, o registro nº 6, também constitui um dado espúrio, de modo que, deveremos recalcular um novo intervalo: Sp = 66593,52, Pori = 92875, n = 8 e (d/Sp)crítico = 1,86 dlim = 66593,52*1.86 = 123863,94 (Pori – dlim) ≤ Pori (i) ≤ (Pori + dlim) -30988,94 ≤ Pori (i) ≤ 216738,94 Com isto, a amostra já está saneada. 2º) Cálculo das Correlações, Regressores e Anova. Registro n.º 1 2 3 4 5 6 7 8 VT Área DIST. 170000 100000 150000 180000 50000 20000 55000 18000 422 360 205 901 430 280 360 200 0 0 110 40 40 40 40 40 (esquina) (esquina) CORRELAÇÕES VT VT Área DIST. Área 1 0,571241 0,0396682 DIST. 1 0,813187 1 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,926914 R-Quadrado 0,859169 R-quadrado 0,802837 ajustado Erro padrão 29569,56 Observações 8 ANOVA gl Regressão Resíduo SQ 2 2,67E+10 5 4,37E+09 MQ F F de signific. 1,33E+10 15,25179 0,007443 8,74E+08 33 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Total 7 Coeficientes 3,1E+10 Erro padrão Interseção 80100,28 16575,96 Área 172,5055 31,26266 DIST. -2457,27 564,9533 Inferior Superior 80,0% 80,0% 55636,08 104564,5 126,3654 218,6456 -3291,07 -1623,46 Stat t valor-P 95% inferiores 95% superiores 37490,5 122710,1 92,14243 252,8686 -3909,52 -1005,01 4,832317 0,004747 5,517941 0,002677 -4,34951 0,007363 Tabela 4.2.1 3º) Teste de hipótese nula da regressão (ß1 = 0 e ß2 = 0) Testada a hipótese nula da regressão (ß1 = 0 e ß2 = 0), ambas foram aceitas , uma vez que: Fcalculado= 15,25179 < F (λ) (k), (n-k-1) = F (1%) (2), (5) = 13,27 (tabelado) Como rejeitamos a hipótese de nulidade de ß1 e ß2 , então, a equação de regressão obtida pela modelagem é significante ao nível de 1% para explicar o comportamento de mercado. 4.3. A tabela a seguir se refere a uma pesquisa de apartamentos na cidade de Campo Grande - MS. Registrou-se os preços dos apartamentos em oferta, suas áreas, valores de condomínio, número de vagas de garagem, se posui portaria, quadra, piscina e Sacada. Pretendese encontrar o valor de mercado de um imóvel com as seguintes características: Área = 115m² Condomínio = R$ 150,00 Garagem = 1 vaga Portaria = Possui (Recebe valor 1 por se tratar de uma variável dicotômica) Armário = Não Possui (Recebe valor 0 por se tratar de uma variável dicotômica) Quadra = Possui (Recebe valor 1 por se tratar de uma variável dicotômica) Piscina = Não Possui (Recebe valor 0 por se tratar de uma variável dicotômica) Sacada = Possui (Recebe valor 1 por se tratar de uma variável dicotômica) Nº registro 1 2 3 4 5 Residencial Cachoeirinha II Itacolomi Via Park Dominica Valor Área Cond. Garagem Portaria Armário Quadra Piscina Sacada R$ 140.000 118 R$ 255 2 1 1 1 0 0 R$ 145.000 R$ 185.000 R$ 145.000 R$ 95.000 98 103 107 73 R$ 350 R$ 0 R$ 220 R$ 180 1 2 2 1 1 0 1 1 1 1 0 0 1 0 0 0 1 0 1 1 1 0 1 1 34 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 Tacuma Cachoeirinha II Vitoria Monte Castelo Sevilha Parque dos coqueiros Cedro Marques de Labradil Las Palmas Sam Lorenço Mangaratiba Nova Suécia Nova Portugal Nova Inglaterra R$ 195.000 154 R$ 0 2 0 1 0 0 1 R$ 130.000 102 R$ 255 1 1 1 1 0 0 R$ 140.000 R$ 210.000 70 122 R$ 0 R$ 240 1 1 0 1 1 0 0 1 0 1 0 1 R$ 185.000 116 R$ 260 2 1 0 1 0 1 R$ 90.000 80 R$ 220 1 1 1 1 0 1 R$ 75.000 72 R$ 150 1 0 1 0 0 1 R$ 90.000 78 R$ 215 1 1 1 1 1 1 R$ 110.000 90 R$ 110 1 1 0 0 0 1 R$ 95.000 R$ 85.000 R$ 125.000 R$ 85.000 R$ 105.000 93 87 76 87 110 R$ 130 R$ 180 R$ 275 R$ 190 R$ 200 1 1 2 1 2 1 1 1 1 1 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 R$ 93.000 110 R$ 215 2 1 1 0 0 0 R$ 100.000 110 R$ 200 2 1 1 0 0 0 Planilha 4.3.1 1º) Verificação da colinearidade. Supondo a amostra já saneada pelo critério de Chauvenet, calcula-se a tabela de correlações obtendo o seguinte resultado: Valor Valor Área Cond. Garagem Portaria Armário Quadra Piscina Sacada 1,00 0,66 -0,15 0,36 -0,29 -0,10 0,29 0,16 0,22 Área 1,00 -0,05 0,58 -0,04 0,12 0,03 -0,17 -0,05 Cond. 1,00 -0,02 0,78 -0,21 0,66 0,45 0,22 Garagem Portaria Armário Quadra Piscina Sacada 1,00 -0,07 0,08 -0,08 -0,12 -0,14 1,00 -0,38 0,38 0,31 0,02 1,00 0,01 -0,37 -0,36 1,00 0,37 0,36 1,00 0,60 1,00 Tabela 4.3.1 35 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Verifica-se que a variável “condomínio” possui uma correlação alta com a variável “portaria”, faremos o cálculo dos FIVs para verificar se alguma variável deve ser excluída do modelo. Os FIVs calculados são: - Área: FIV = 1,66 - Condomínio: FIV = 4,78 - Garagem: FIV = 1,64 - Portaria: FIV = 3,72 - Armário: FIV = 1,66 - Quadra: FIV = 2,24 - Piscina: FIV = 1,99 - Sacada: FIV = 2,09 Como todos os FIVs são menores que 5 não há problema de colinearidade no modelo. 2º) Calculo da estatística de regressão e anova. RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,935055217 R-Quadrado 0,874328258 R-quadrado ajustado 0,790547097 Erro padrão 18540,55309 Observações 21 ANOVA gl Regressão Resíduo Total Interseção Área Cond. Garagem Portaria Armário Quadra Piscina SQ MQ 8 2,87E+10 3,59E+09 12 4,125E+09 3,44E+08 20 3,282E+10 Coeficientes 61518,859 1328,125 -141,130 1530,987 -50393,393 -33156,881 51370,673 29013,363 Erro padrão 25665,059 256,993 98,052 10479,344 19875,963 10723,162 12464,005 12644,275 Stat t 2,397 5,168 -1,439 0,146 -2,535 -3,092 4,122 2,295 F 10,44 F de significação 0,0002353 valor-P 95% inferiores 0,034 5599,498 0,000 768,186 0,176 -354,768 0,886 -21301,543 0,026 -93699,397 0,009 -56520,644 0,001 24213,938 0,041 1463,853 95% superiores 117438,219 1888,064 72,508 24363,516 -7087,390 -9793,117 78527,407 56562,872 36 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Sacada -18193,101 11705,927 -1,554 0,146 -43698,125 7311,923 Tabela 4.3.2 3º) Teste de hipótese nula da regressão Pelo teste F, a mesma foi rejeitada ao nível de 1%, uma vez que: F de sifnificaç ão 0,0002353 0,01 (O modelo é significativo) 4º) Teste de hipótese nula dos regressores Testando as variáveis ao nível de 20%, tem-se: Área - Valor P 0,00 0,20 (Significativa para o modelo) Condominio - Valor P 0,18 0,20 (Significativa para o modelo) Garagem - Valor P 0,88 0,20 (Não é significativa para o modelo) Portaria - Valor P 0,03 0,20 (Significativa para o modelo) Armário - Valor P 0,01 0,20 (Significativa para o modelo) Quadra - Valor P 0,00 0,20 (Significativa para o modelo) Piscina - Valor P 0,04 0,20 (Significativa para o modelo) Sacada - Valor P 0,15 0,20 (Significativa para o modelo) 5º) Análise crítica dos valores obtidos na regressão Ao término do calculo das estatísticas de regressão e dos testes de hipóteses devemos verificar se o modelo realmente serve para explicar o comportamento real do mercado imobiliário. A priori esta tudo correto em nosso modelo, mas vamos nos atentar aos coeficientes obtidos para as variáveis: Portaria, Armário e Sacada. Coeficientes: -Portaria = R$ -50393,39 -Armário = R$ -33156,88 -Sacada = R$ -18193,10 Os coeficientes negativos para estas variáveis não condizem com a realidade. Podemos ver através do exemplo: Um apartamento que não possua Armário Embutido tem um valor de mercado, se o seu proprietário resolver investir na instalação de Armário Embutido no apartamento seu apartamento, este investimento ira agregar valor ao imóvel, ao contrário do que diz o modelo, cujo diz que se o proprietário investir na instalação de armário embutido o valor do imóvel irá diminuir em R$ 33156,88. Para tentar descobrir o que esta afetando o modelo de regressão plota-se gráficos das variáveis explicativas versus variável explicada, conforme demonstrado a seguir: 37 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Gráfico 4.3.1 Pontos indicados pelas setas correspondem as amostras: 3, 6, 8, 9 e 10 Gráfico 4.3.2 Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10 38 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Gráfico 4.3.3 Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10 Gráfico 4.3.4 Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10 39 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Gráfico 4.3.5 Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10 Gráfico 4.3.6 Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10 40 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Gráfico 4.3.7 Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10 Gráfico 4.3.8 Pontos indicados pelas setas correspondem as amostras: 3, 6, 9 e 10 A plotagem desses gráficos é feita para verificar a existência de pontos influenciantes. “Entendese por pontos influenciantes aqueles com pequenos resíduos, em algumas vez até nulos, mas que se distanciam da massa de dados, podendo alterar completamente as tendências naturais indicadas pelo mercado (DANTAS, 2005, p. 113).” 41 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Pode-se concluir então que as amostras 3, 6, 9, 10 são pontos influenciantes no modelo, a solução é excluir esses dados de nossa amostra e proceder a analise de regressão novamente. Após a exclusão a planilha deve ficar como a planilha 4.3.2: Nº registro 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Residencial Cachoeirinha II Itacolomi Dominica Cachoeirinha II Vitoria Sevilha Parque dos coqueiros Cedro Marques de Labradil Las Palmas Sam Lorenço Mangaratiba Nova Suécia Nova Portugal Nova Inglaterra Valor Área Cond. Garagem Portaria Armário Quadra Piscina Sacada R$ 140.000 118 R$ 255 2 1 1 1 0 0 R$ 145.000 R$ 145.000 R$ 95.000 98 107 73 R$ 350 R$ 220 R$ 180 1 2 1 1 1 1 1 0 0 1 0 0 1 1 1 1 1 1 R$ 130.000 102 R$ 255 1 1 1 1 0 0 R$ 140.000 R$ 90.000 70 80 R$ 0 R$ 220 1 1 0 1 1 1 0 1 0 0 0 1 R$ 75.000 72 R$ 150 1 0 1 0 0 1 R$ 90.000 78 R$ 215 1 1 1 1 1 1 R$ 110.000 90 R$ 110 1 1 0 0 0 1 R$ 95.000 R$ 85.000 R$ 125.000 R$ 85.000 R$ 105.000 93 87 76 87 110 R$ 130 R$ 180 R$ 275 R$ 190 R$ 200 1 1 2 1 2 1 1 1 1 1 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 R$ 93.000 110 R$ 215 2 1 1 0 0 0 R$ 100.000 110 R$ 200 2 1 1 0 0 0 Planilha 4.3.2 *Observe que o número de registro das amostras foram alterados para que não haja confusão quanto ao número real de amostras do modelo. Verificando se ainda existem pontos influenciantes no modelo, plota-se o gráfico do Valor x Área (Gráfico 4.3.9), que supostamente é a variável que mais influencia no modelo. Como demonstrado no gráfico 4.3.9, ainda existem pontos influenciantes no modelo. 42 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Gráfico 4.3.9 Pontos indicados pelas setas correspondem as amostras: 2, 6, 13 e 17 Procedendo novamente a exclusão das amostras que foram consideradas como pontos influenciantes, temos uma nova planilha: Nº registro 1 2 3 4 5 6 7 8 9 10 11 12 13 Residencial Cachoeirinha II Dominica Cachoeirinha II Sevilha Parque dos coqueiros Cedro Marques de Labradil Las Palmas Mangaratiba Nova Suécia Nova Portugal Valor Área Cond. Garagem Portaria Armário Quadra Piscina Sacada R$ 140.000 118 R$ 255 2 1 1 1 0 0 R$ 145.000 R$ 95.000 107 73 R$ 220 R$ 180 2 1 1 1 0 0 0 0 1 1 1 1 R$ 130.000 102 R$ 255 1 1 1 1 0 0 R$ 90.000 80 R$ 220 1 1 1 1 0 1 R$ 75.000 72 R$ 150 1 0 1 0 0 1 R$ 90.000 78 R$ 215 1 1 1 1 1 1 R$ 110.000 90 R$ 110 1 1 0 0 0 1 R$ 95.000 R$ 85.000 R$ 85.000 R$ 105.000 93 87 87 110 R$ 130 R$ 180 R$ 190 R$ 200 1 1 1 2 1 1 1 1 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 R$ 93.000 110 R$ 215 2 1 1 0 0 0 Planilha 4.3.3 6º) Calculo da estatística de regressão e anova para a nova planilha. 43 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,97 R-Quadrado 0,94 R-quadrado ajustado 0,83 Erro padrão Observações 9070,31 13,00 ANOVA gl Regressão Resíduo Total 8 4 12 F de SQ MQ F significação 5,58E+09 6,98E+08 8,48396 0,02767 3,29E+08 8,23E+07 5,91E+09 Coeficientes Erro padrão Interseção Área Cond. Garagem Portaria Armário Quadra Piscina Sacada -100482,85 2810,96 30,86 -38747,74 -23408,23 -12745,33 10060,42 18423,20 19958,17 55292,778 599,113 162,813 19758,679 14971,673 9749,310 17584,117 10288,165 12599,302 Stat t valor-P -1,817 4,692 0,190 -1,961 -1,564 -1,307 0,572 1,791 1,584 0,143 0,009 0,859 0,121 0,193 0,261 0,598 0,148 0,188 95% inferiores 95% superiores 254000,212 1147,557 -421,186 -93606,632 -64976,258 -39813,757 -38760,919 -10141,328 -15023,101 53034,513 4474,366 482,899 16111,143 18159,800 14323,090 58881,752 46987,722 54939,439 Tabela 4.3.3 Como possuímos apenas 13 amostras devemos escolher no máximo 3 variáveis para o modelo, pois a norma exige que n 3(k 1) , onde k é o numero de variáveis independentes. Serão escolhidas as variáveis: área, piscina e sacada, pois apresentem coeficiente com sinal coerente com a realidade de mercado e são significantes ao nível de 20%. Temos então uma nova planilha contendo apenas as 3 variáveis escolhidas. 44 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Nº registro Residencial Cachoeirinha II Dominica Cachoeirinha II Sevilha Parque dos coqueiros Cedro Marques de Labradil Las Palmas Mangaratiba Nova Suécia Nova Portugal 1 2 3 4 5 6 7 8 9 10 11 12 13 Valor Área Piscina Sacada R$ 140.000 118 0 0 R$ 145.000 R$ 95.000 107 73 1 1 1 1 R$ 130.000 102 0 0 R$ 90.000 80 0 1 R$ 75.000 72 0 1 R$ 90.000 78 1 1 R$ 110.000 90 0 1 R$ 95.000 R$ 85.000 R$ 85.000 R$ 105.000 93 87 87 110 0 0 0 0 0 0 0 0 R$ 93.000 110 0 0 Planilha 4.3.4 7º) Calculo da estatística de regressão e anova para planilha com 3 variáveis. RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,853295582 R-Quadrado 0,72811335 R-quadrado ajustado 0,637484466 Erro padrão 13365,14891 Observações 13 ANOVA gl Regressão Resíduo Total 3 9 12 SQ MQ 4,31E+09 1435092742 1,61E+09 178627205,5 5,91E+09 F de F significação 8,034 0,0065 45 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Coeficientes Erro padrão Interseção Área Piscina Sacada -43408,756 1466,565 10511,655 16772,531 32710,009 319,976 11045,229 11286,761 Stat t valor-P -1,327 4,583 0,952 1,486 95% inferiores 95% superiores 0,217 117403,937 30586,425 0,001 742,728 2190,401 0,366 -14474,389 35497,698 0,171 -8759,895 42304,958 RESULTADOS DE RESÍDUOS Observação Previsto(a) Valor Resíduos Resíduos padrão 1 129645,89 10354,11 0,89 2 140797,86 4202,14 0,36 3 90934,66 4065,34 0,35 4 106180,85 23819,15 2,06 5 90688,96 -688,96 -0,06 6 78956,44 -3956,44 -0,34 7 98267,48 -8267,48 -0,71 8 105354,60 4645,40 0,40 9 92981,77 2018,23 0,17 10 84182,38 817,62 0,07 11 84182,38 817,62 0,07 12 117913,37 -12913,37 -1,12 13 117913,37 -24913,37 -2,15 Tabela 4.3.4 Observe que temos duas amostras com resíduos altos. Deve-se verificar a amostra quanto a presença de outliers. “Entende-se por outlier um dado que contém grande resíduo em relação aos demais que compõe a amostra. Estes pontos ponde ser detectados com facilidade através de uma análise gráfica dos resíduos padronizados versus os valores previsto (DANTAS, 2005, p. 112).” Plota-se o gráfico 4.3.10 Resíduos padrão x Previsto(a) Valor, através de uma analise visual é possível identificar a presença de dois outliers indicados pelas setas correspondentes as amostras 4 e 13. Para prosseguir deve-se excluir as duas amostras do modelo, e conseqüente deve-se excluir também uma variável, pois como teremos apenas 11amostras quando a norma exige no mínimo 12 amostras para um modelo com 3 variáveis. Excluiremos a variável piscina, pois é a única das 3 variáveis que não é significante para o modelo. 46 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Gráfico 4.3.10 Após a exclusão das amostras 4 e 13 e da variável piscina, a planilha ficara como a planilha 4.3.5. Nº registro 1 2 3 4 5 6 7 8 9 10 11 Residencial Cachoeirinha II Dominica Sevilha Parque dos coqueiros Cedro Marques de Labradil Las Palmas Mangaratiba Nova Suécia Valor Área Sacada R$ 140.000 118 0 R$ 145.000 R$ 95.000 R$ 90.000 107 73 80 1 1 1 R$ 75.000 72 1 R$ 90.000 78 1 R$ 110.000 90 1 R$ 95.000 R$ 85.000 R$ 85.000 R$ 105.000 93 87 87 110 0 0 0 0 Planilha 4.3.5 Continuaremos verificando a presença de outliers, para isso calculamos novamente a tabela de resíduos da planilha 4.3.5. RESULTADOS DE RESÍDUOS 47 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Observação 1 2 3 4 5 6 7 8 9 10 11 Previsto(a) Valor 133096,72 139567,84 83921,08 95377,77 82284,41 92104,43 111744,46 92179,98 82359,97 82359,97 Resíduos 6903,28 5432,16 11078,92 -5377,77 -7284,41 -2104,43 -1744,46 2820,02 2640,03 2640,03 120003,36 15003,36 Resíduos padrão 0,94 0,74 1,51 -0,73 -0,99 -0,29 -0,24 0,39 0,36 0,36 -2,05 Tabela 4.3.5 Plota-se novamente o gráfico Resíduos padrão x Previsto(a) Gráfico 4.3.11 Através de uma analise visual é possível identificar a presença de dois outliers indicados pelas setas, correspondentes as amostras 3 e 11. Para prosseguir deve-se excluir do modelo as amostras 3 e 11 e fazer nova verificação. A nova planilha ficará como a planilha a seguir: 48 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Nº registro 1 2 3 4 5 6 7 8 9 Residencial Cachoeirinha II Sevilha Parque dos coqueiros Cedro Marques de Labradil Las Palmas Mangaratiba Valor Área Sacada R$ 140.000 118 0 R$ 145.000 R$ 90.000 107 80 1 1 R$ 75.000 72 1 R$ 90.000 78 1 R$ 110.000 90 1 R$ 95.000 R$ 85.000 R$ 85.000 93 87 87 0 0 0 Planilha 4.3.6 Calculando novamente a tabela de resíduos: RESULTADOS DE RESÍDUOS Previsto(a) Resíduos Observação Valor Resíduos padrão 1 142164,20 -2164,20 -1,26 2 142632,03 2367,97 1,38 3 91841,99 -1841,99 -1,07 4 76793,09 -1793,09 -1,04 5 88079,77 1920,23 1,12 6 110653,12 -653,12 -0,38 7 95136,38 -136,38 -0,08 8 83849,71 1150,29 0,67 9 83849,71 1150,29 0,67 Tabela 4.3.6 49 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Plota-se novamente o gráfico Resíduos padrão x Previsto(a) Gráfico 4.3.12 Através da analise visual, verifica-se que não há presença de outliers. Adota-se então este conjunto de amostras para compor o modelo. 8º) Calculo da estatística de regressão e Anova para planilha com 2 variáveis e 9 amostras. Nº registro 1 2 3 4 5 6 7 8 9 Residencial Cachoeirinha II Sevilha Parque dos coqueiros Cedro Marques de Labradil Las Palmas Mangaratiba Valor Área Sacada R$ 140.000 118 0 R$ 145.000 R$ 90.000 107 80 1 1 R$ 75.000 72 1 R$ 90.000 78 1 R$ 110.000 90 1 R$ 95.000 R$ 85.000 R$ 85.000 93 87 87 0 0 0 Planilha 4.3.7 Estatística de regressão 50 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 R múltiplo R-Quadrado R-quadrado ajustado Erro padrão Observações 0,998 0,995 0,994 1986,536 9 ANOVA gl Regressão Resíduo Total Interseção Área Sacada SQ MQ 2 4,98E+09 2,49E+09 6 2,37E+07 3,95E+06 8 5,00E+09 Coeficientes -79807,07 1881,11 21160,07 Erro padrão 5195,15 52,98 1451,30 F 630,50 Stat t valor-P -15,36 4,81E-06 35,51 3,33E-08 14,58 6,53E-06 F de significação 1,06E-07 95% 95% inferiores superiores -92519,2 -67095,0 1751,5 2010,7 17608,9 24711,3 Tabela 4.3.7 Pode-se observar que os coeficientes referentes as variáveis são positivos o que condizem com a realidade de mercado. Percebe-se também que com a exclusão dos pontos influenciantes e outliers do modelo, conseguiu-se uma melhora significativa no modelo de regressão. 9º) Teste de hipótese nula da regressão Pelo teste F, a mesma foi rejeitada ao nível de 1%, uma vez que: F de sifnificaç ão 1,06E - 07 0,01 (O modelo é significativo) 10º) Teste de hipótese nula dos regressores Testando as variáveis ao nível de 1%, tem-se: Área - Valor P 3,33E - 08 0,01 (Significativa para o modelo) Sacada - Valor P 6,53E - 06 0,01 (Significativa para o modelo) 11º) Determinação do valor de mercado do imóvel e intervalo de confiança 51 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 Como descrito no enunciado do exercício, o imóvel possui as seguintes características: Área = 115m² Sacada = Possui (Recebe valor 1 por se tratar de uma variável dicotômica) Data Confidence Level 80% 1 115 1 Área given value Sacada given value Predicted Y (YHat) 157680,9 For Average Predicted Y (Yhat) Interval Half Width 2594,971 Confidence Interval Lower Limit 155086,00 Confidence Interval Upper Limit 160275,90 PÛ 1881,11 Área 21160,07 Sacada 79807,07 Substituindo os valores das variáveis independentes do imóvel avaliando, temos que o valor previsto para o imóvel é: PÛ = R$ 157680,90 Intervalo de confiança para o valor previsto: R$ 155086,00 < PÛ < R$ 160275,90 A NBR 14653-2:2003 sugere a classificação da avaliação quanto ao Grau de Precisão (item 9.2.2). O nível de precisão é encontrado através do valor em porcentagem da amplitude do intervalo de confiança de 80% sobre o valor pontual da avaliação. AMPLITUDE PÛ sup PÛ inf PÛ 160275,90 155086,00 0,033 3,3% 157680,90 Como a amplitude é menor do que 30% ,através da Tabela 1.7 podemos classificar a avaliação com Grau de Precisão 3. Obs: Fica a cargo do leitor realizar a verificação das hipóteses básicas do modelo. 5. Bibliografia DANTAS, Rubens Alves (2005) Engenharia de avaliações: uma introdução a metodologia científica. 2. ed. rev. de acordo com a NBR-14653-2:2004. São Paulo: PINI. 52 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 GUNST, Richard F., MASON, Robert L., Regression Analysis and its application: A data-Oriented Approach. Nova York: MARCEL DEKKER, INC. Levine, David M e outros (2005). Estatística – Teoria e aplicações usando o Microsoft Excel em português. Trad. Eduardo Benedito Curtolo e Teresa Cristina Padilha de Souza. 3ª ed. Rio de Janeiro: LTC. NBR – 14653 – “Norma Brasileira para Avaliação de Bens”. ABNT. Acedido em 18 de agosto de 2009, no Web site da: Universidade Federal de Santa Catarina: http://www.inf.ufsc.br/~ogliari/arquivos/regressao_linear_multipla.ppt#33 Acedido em 21 de agosto de 2009, no Web site da: Universidade Federal do Pernambuco: http://www.de.ufpe.br/~gjaa/Introreg.doc Acedido em 27 de agosto de 2009, no Web site da: Universidade Federal do Pernambuco: http://www.cin.ufpe.br/~rmcrs/ESAP/arquivos/RegressaoMultipla.pdf 6. Anexo 1 53 FUFMS - CCET –DEC - LADE Avaliações e Perícias na Construção Civil Introdução às Ferramentas de Análise Estatística do Excel 2007 aplicadas a Engª de avaliações Prof. Wagner Augusto Andreasi, M. Engª. Acad. Ademir A. Peixoto de Azevedo - v.2002 e Acad. Thiago Winter Macinelli – v.2009 . (DANTAS, 2005, p. 238) 54