Estimação de variância em pesquisas por amostragem com dados imputados pelo método Hot-Deck: Uma comparação empírica

dc.contributor.advisorSilva, Damião Nóbrega da
dc.contributor.authorApolinário, Carla de Moraes
dc.contributor.referees1Barbosa, Denize Araújo
dc.contributor.referees2Pinho, André Luís Santos de
dc.date.accessioned2021-05-06T01:25:35Z
dc.date.accessioned2021-09-20T12:08:49Z
dc.date.available2021-05-06T01:25:35Z
dc.date.available2021-09-20T12:08:49Z
dc.date.issued2019-12-12
dc.description.abstractIn many sample surveys, it is common the presence of missing data, a problem also known as non-response. This problem occurs due to possible failures in obtaining some of the information that should be collected in the sample. Ignoring non-response, by analyzing the observed data only, is a simple way to approach the problem, but it could produce bias in the survey results. One of the techniques for treating non-response is by imputation, that is by replacing the missing data with appropriately chosen values, seeking to eliminate or reduce the non-response bias. Using imputation, the data set is completed so that valid estimates of population parameters and their variances could be obtained more easily. However, the validity of such estimates needs to be carefully evaluated, as imputation may also be subject to estimation bias. In this work, a Monte Carlo simulation study is used to evaluate empirically statistical properties of estimators of a finite population mean under a missing completely at random and missing-at-random response mechanisms. The population mean estimators used in the study correspond to the average of the data observed among the sample respondents and the average of the data after hot-deck imputation, which is a popular imputation method. The study also compares variances estimators of methods based only on the respondent data, treating of imputed data as true values, application of the usual Jackknife, application of the Rao and Shao Jackknife, Multiple Imputation, and the Approximate Bayesian Bootstrap. The results of the study demonstrate, for each non-response mechanism, which methods estimate appropriately the population parameter of interest and the respective variances.pt_BR
dc.description.resumoEm diversos levantamentos por amostragem, é comum a presença de dados faltantes, que é um problema também denominado de não-resposta. Este problema ocorre devido a possíveis falhas na obtenção de uma parte das informações que deveriam ser coletadas na amostra. Ignorar a não-resposta, analisando-se apenas os dados observados, é uma forma simples de abordar o problema, mas que pode produzir tendenciosidades nos resultados do levantamento. Uma das técnicas para tratamento da não-resposta é a imputação, isto é, a substituição dos dados faltantes por valores escolhidos apropriadamente, visando eliminar ou reduzir as tendenciosidades devido à não-resposta. A partir da imputação, o conjunto de dados é completado para que estimativas válidas dos parâmetros populacionais e das respectivas variâncias possam ser obtidas mais facilmente. Contudo, a validade destas estimativas precisa ser avaliada cuidadosamente, pois em alguns casos a imputação, por si própria, pode também estar sujeita a tendenciosidades de estimação. Neste trabalho, é usado um estudo de simulação de Monte Carlo para avaliar empiricamente propriedades estatísticas de estimadores da média de uma população finita sob mecanismos de não-resposta com dados faltantes completamente aleatórios e com dados faltantes aleatórios. Os estimadores da média populacional usados no estudo correspondem à média dos dados observados entre os respondentes da amostra e à média dos dados após imputação hot-deck, que é um método popular de imputação em Amostragem. O estudo compara também estimadores das variâncias dos métodos baseados nos dados dos respondentes, no tratamento os dados imputados como ser fossem verdadeiros, na aplicação do Jackknife usual, na aplicação do Jackknife de Rao e Shao, na Imputação múltipla e no Bootstrap Bayesiano Aproximado. Os resultados do estudo demonstram, para cada um dos mecanismos de não-resposta, que métodos estimam apropriadamente o parâmetro populacional de interesse e as respectivas variâncias.pt_BR
dc.identifier2016032232pt_BR
dc.identifier.citationAPOLINÁRIO, Carla de Moraes. Estimação de variância em pesquisas por amostragem com dados imputados pelo método Hot-Deck: Uma comparação empírica. 2019. TCC (Graduação) - Curso de Estatística, Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2021.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/34297
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentEstatísticapt_BR
dc.publisher.initialsUFRNpt_BR
dc.subjectAnálise de dados incompletospt_BR
dc.subjectBootstrap Bayesiano aproximadopt_BR
dc.subjectDados faltantespt_BR
dc.subjectImputação Múltiplapt_BR
dc.subjectJackknifept_BR
dc.subjectMétodo de Rao e Shaopt_BR
dc.subjectNão-respostapt_BR
dc.subject.cnpqAmostragem estatísticapt_BR
dc.titleEstimação de variância em pesquisas por amostragem com dados imputados pelo método Hot-Deck: Uma comparação empíricapt_BR
dc.title.alternativeEstimation of variance in sample surveys with data imputed by the Hot-Deck method: An empirical comparisonpt_BR
dc.typebachelorThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
EstimaçãoDeVariância_Apolinário_2019.pdf
Tamanho:
708.88 KB
Formato:
Adobe Portable Document Format
Descrição:
Monografia
Nenhuma Miniatura disponível
Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
714 B
Formato:
Plain Text
Nenhuma Miniatura disponível
Baixar