Estimação de variância em pesquisas por amostragem com dados imputados pelo método Hot-Deck: Uma comparação empírica
dc.contributor.advisor | Silva, Damião Nóbrega da | |
dc.contributor.author | Apolinário, Carla de Moraes | |
dc.contributor.referees1 | Barbosa, Denize Araújo | |
dc.contributor.referees2 | Pinho, André Luís Santos de | |
dc.date.accessioned | 2021-05-06T01:25:35Z | |
dc.date.accessioned | 2021-09-20T12:08:49Z | |
dc.date.available | 2021-05-06T01:25:35Z | |
dc.date.available | 2021-09-20T12:08:49Z | |
dc.date.issued | 2019-12-12 | |
dc.description.abstract | In many sample surveys, it is common the presence of missing data, a problem also known as non-response. This problem occurs due to possible failures in obtaining some of the information that should be collected in the sample. Ignoring non-response, by analyzing the observed data only, is a simple way to approach the problem, but it could produce bias in the survey results. One of the techniques for treating non-response is by imputation, that is by replacing the missing data with appropriately chosen values, seeking to eliminate or reduce the non-response bias. Using imputation, the data set is completed so that valid estimates of population parameters and their variances could be obtained more easily. However, the validity of such estimates needs to be carefully evaluated, as imputation may also be subject to estimation bias. In this work, a Monte Carlo simulation study is used to evaluate empirically statistical properties of estimators of a finite population mean under a missing completely at random and missing-at-random response mechanisms. The population mean estimators used in the study correspond to the average of the data observed among the sample respondents and the average of the data after hot-deck imputation, which is a popular imputation method. The study also compares variances estimators of methods based only on the respondent data, treating of imputed data as true values, application of the usual Jackknife, application of the Rao and Shao Jackknife, Multiple Imputation, and the Approximate Bayesian Bootstrap. The results of the study demonstrate, for each non-response mechanism, which methods estimate appropriately the population parameter of interest and the respective variances. | pt_BR |
dc.description.resumo | Em diversos levantamentos por amostragem, é comum a presença de dados faltantes, que é um problema também denominado de não-resposta. Este problema ocorre devido a possíveis falhas na obtenção de uma parte das informações que deveriam ser coletadas na amostra. Ignorar a não-resposta, analisando-se apenas os dados observados, é uma forma simples de abordar o problema, mas que pode produzir tendenciosidades nos resultados do levantamento. Uma das técnicas para tratamento da não-resposta é a imputação, isto é, a substituição dos dados faltantes por valores escolhidos apropriadamente, visando eliminar ou reduzir as tendenciosidades devido à não-resposta. A partir da imputação, o conjunto de dados é completado para que estimativas válidas dos parâmetros populacionais e das respectivas variâncias possam ser obtidas mais facilmente. Contudo, a validade destas estimativas precisa ser avaliada cuidadosamente, pois em alguns casos a imputação, por si própria, pode também estar sujeita a tendenciosidades de estimação. Neste trabalho, é usado um estudo de simulação de Monte Carlo para avaliar empiricamente propriedades estatísticas de estimadores da média de uma população finita sob mecanismos de não-resposta com dados faltantes completamente aleatórios e com dados faltantes aleatórios. Os estimadores da média populacional usados no estudo correspondem à média dos dados observados entre os respondentes da amostra e à média dos dados após imputação hot-deck, que é um método popular de imputação em Amostragem. O estudo compara também estimadores das variâncias dos métodos baseados nos dados dos respondentes, no tratamento os dados imputados como ser fossem verdadeiros, na aplicação do Jackknife usual, na aplicação do Jackknife de Rao e Shao, na Imputação múltipla e no Bootstrap Bayesiano Aproximado. Os resultados do estudo demonstram, para cada um dos mecanismos de não-resposta, que métodos estimam apropriadamente o parâmetro populacional de interesse e as respectivas variâncias. | pt_BR |
dc.identifier | 2016032232 | pt_BR |
dc.identifier.citation | APOLINÁRIO, Carla de Moraes. Estimação de variância em pesquisas por amostragem com dados imputados pelo método Hot-Deck: Uma comparação empírica. 2019. TCC (Graduação) - Curso de Estatística, Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2021. | pt_BR |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/34297 | |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade Federal do Rio Grande do Norte | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Estatística | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.subject | Análise de dados incompletos | pt_BR |
dc.subject | Bootstrap Bayesiano aproximado | pt_BR |
dc.subject | Dados faltantes | pt_BR |
dc.subject | Imputação Múltipla | pt_BR |
dc.subject | Jackknife | pt_BR |
dc.subject | Método de Rao e Shao | pt_BR |
dc.subject | Não-resposta | pt_BR |
dc.subject.cnpq | Amostragem estatística | pt_BR |
dc.title | Estimação de variância em pesquisas por amostragem com dados imputados pelo método Hot-Deck: Uma comparação empírica | pt_BR |
dc.title.alternative | Estimation of variance in sample surveys with data imputed by the Hot-Deck method: An empirical comparison | pt_BR |
dc.type | bachelorThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- EstimaçãoDeVariância_Apolinário_2019.pdf
- Tamanho:
- 708.88 KB
- Formato:
- Adobe Portable Document Format
- Descrição:
- Monografia
Nenhuma Miniatura disponível
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 714 B
- Formato:
- Plain Text
Nenhuma Miniatura disponível