Use este identificador para citar ou linkar para este item: https://repositorio.ufrn.br/handle/123456789/34297
Título: Estimação de variância em pesquisas por amostragem com dados imputados pelo método Hot-Deck: Uma comparação empírica
Título(s) alternativo(s): Estimation of variance in sample surveys with data imputed by the Hot-Deck method: An empirical comparison
Autor(es): Apolinário, Carla de Moraes
Orientador: Silva, Damião Nóbrega da
Palavras-chave: Análise de dados incompletos;Bootstrap Bayesiano aproximado;Dados faltantes;Imputação Múltipla;Jackknife;Método de Rao e Shao;Não-resposta
Data do documento: 12-Dez-2019
Editor: Universidade Federal do Rio Grande do Norte
Referência: APOLINÁRIO, Carla de Moraes. Estimação de variância em pesquisas por amostragem com dados imputados pelo método Hot-Deck: Uma comparação empírica. 2019. TCC (Graduação) - Curso de Estatística, Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2021.
Resumo: Em diversos levantamentos por amostragem, é comum a presença de dados faltantes, que é um problema também denominado de não-resposta. Este problema ocorre devido a possíveis falhas na obtenção de uma parte das informações que deveriam ser coletadas na amostra. Ignorar a não-resposta, analisando-se apenas os dados observados, é uma forma simples de abordar o problema, mas que pode produzir tendenciosidades nos resultados do levantamento. Uma das técnicas para tratamento da não-resposta é a imputação, isto é, a substituição dos dados faltantes por valores escolhidos apropriadamente, visando eliminar ou reduzir as tendenciosidades devido à não-resposta. A partir da imputação, o conjunto de dados é completado para que estimativas válidas dos parâmetros populacionais e das respectivas variâncias possam ser obtidas mais facilmente. Contudo, a validade destas estimativas precisa ser avaliada cuidadosamente, pois em alguns casos a imputação, por si própria, pode também estar sujeita a tendenciosidades de estimação. Neste trabalho, é usado um estudo de simulação de Monte Carlo para avaliar empiricamente propriedades estatísticas de estimadores da média de uma população finita sob mecanismos de não-resposta com dados faltantes completamente aleatórios e com dados faltantes aleatórios. Os estimadores da média populacional usados no estudo correspondem à média dos dados observados entre os respondentes da amostra e à média dos dados após imputação hot-deck, que é um método popular de imputação em Amostragem. O estudo compara também estimadores das variâncias dos métodos baseados nos dados dos respondentes, no tratamento os dados imputados como ser fossem verdadeiros, na aplicação do Jackknife usual, na aplicação do Jackknife de Rao e Shao, na Imputação múltipla e no Bootstrap Bayesiano Aproximado. Os resultados do estudo demonstram, para cada um dos mecanismos de não-resposta, que métodos estimam apropriadamente o parâmetro populacional de interesse e as respectivas variâncias.
Abstract: In many sample surveys, it is common the presence of missing data, a problem also known as non-response. This problem occurs due to possible failures in obtaining some of the information that should be collected in the sample. Ignoring non-response, by analyzing the observed data only, is a simple way to approach the problem, but it could produce bias in the survey results. One of the techniques for treating non-response is by imputation, that is by replacing the missing data with appropriately chosen values, seeking to eliminate or reduce the non-response bias. Using imputation, the data set is completed so that valid estimates of population parameters and their variances could be obtained more easily. However, the validity of such estimates needs to be carefully evaluated, as imputation may also be subject to estimation bias. In this work, a Monte Carlo simulation study is used to evaluate empirically statistical properties of estimators of a finite population mean under a missing completely at random and missing-at-random response mechanisms. The population mean estimators used in the study correspond to the average of the data observed among the sample respondents and the average of the data after hot-deck imputation, which is a popular imputation method. The study also compares variances estimators of methods based only on the respondent data, treating of imputed data as true values, application of the usual Jackknife, application of the Rao and Shao Jackknife, Multiple Imputation, and the Approximate Bayesian Bootstrap. The results of the study demonstrate, for each non-response mechanism, which methods estimate appropriately the population parameter of interest and the respective variances.
URI: https://repositorio.ufrn.br/handle/123456789/34297
Outros identificadores: 2016032232
Aparece nas coleções:CCET - TCC - Estatística

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
EstimaçãoDeVariância_Apolinário_2019.pdfMonografia708,88 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.