Loading…
Rank-based inference with responses missing not at random
Missing data have become almost inevitable whenever data are collected. In this paper, interest is given to responses missing not at random in the context of regression modeling. Many of the existing methods for estimating the model parameters lack robustness or efficiency. We propose a robust and e...
Saved in:
Published in: | Canadian journal of statistics 2018-09, Vol.46 (3), p.501-528 |
---|---|
Main Authors: | , |
Format: | Article |
Language: | English |
Subjects: | |
Citations: | Items that this one cites Items that cite this one |
Online Access: | Get full text |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: | Missing data have become almost inevitable whenever data are collected. In this paper, interest is given to responses missing not at random in the context of regression modeling. Many of the existing methods for estimating the model parameters lack robustness or efficiency. We propose a robust and efficient approach towards estimating the true regression parameters when some responses in the regression model are missing not at random. Large sample properties of the proposed estimator are established under mild regularity conditions. Monte Carlo simulation experiments are carried out and they showed that the proposed estimator is more efficient than the least squares estimator whenever the model error distribution is heavy tailed, contaminated or when data contain gross outliers. Finally, the method is illustrated using the ACTG protocol 315 data.
La collecte de données engendre très souvent des valeurs manquantes. Les auteurs s’intéressent aux réponses ne manquant pas au hasard dans un contexte de régression, une situation pour laquelle plusieurs des méthodes existantes manquent de robustesse ou d’efficacité. Les auteurs proposent une approche robuste et efficace pour l’estimation des vrais paramètres de la régression lorsque certaines réponses sont manquantes, mais pas au hasard. Ils établissent les propriétés asymptotiques de l’estimateur proposé sous des hypothèses modérées. Ils présentent des études de Monte Carlo afin de montrer que l’estimateur proposé est plus efficace que celui aux moindres carrés lorsque la distribution de l’erreur a des queues lourdes, qu’elle est contaminée, ou que les données contiennent des valeurs aberrantes. Finalement, ils illustrent la méthode sur les données réelles du protocole ACTG 315. |
---|---|
ISSN: | 0319-5724 1708-945X |
DOI: | 10.1002/cjs.11466 |