Loading…
A semiparametric regression model under biased sampling and random censoring: A local pseudo‐likelihood approach
Methodologies developed for left‐truncated right‐censored failure time data can mostly be categorized according to the assumption imposed on the truncation distribution, i.e., being completely unknown or completely known. While the former approach enjoys robustness, the latter is more efficient when...
Saved in:
Published in: | Canadian journal of statistics 2021-09, Vol.49 (3), p.637-658 |
---|---|
Main Authors: | , |
Format: | Article |
Language: | English |
Subjects: | |
Citations: | Items that this one cites |
Online Access: | Get full text |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: | Methodologies developed for left‐truncated right‐censored failure time data can mostly be categorized according to the assumption imposed on the truncation distribution, i.e., being completely unknown or completely known. While the former approach enjoys robustness, the latter is more efficient when the assumed form of the truncation distribution can be supported by the data. Motivated by data from an HIV/AIDS study, we consider the middle ground and develop methodologies for estimation of a regression function in a semiparametric setting where the truncation distribution is parametrically specified while the failure time, censoring and covariate distribution are left completely unknown. We devise an estimator for the regression function based on a local pseudo‐likelihood approach that properly accounts for the bias induced on the response variable and covariate(s) by the sampling design. One important spin‐off from these results is that they yield the adjustment for length‐biased sampling and right‐censoring; the so‐called stationary case. We study the small and large sample behaviour of our estimators. The proposed method is then applied to analyze a set of HIV/AIDS data.
Résumé
La méthodologie développée pour les données tronquées à gauche et censurées à droite peut généralement être classée en deux groupes selon les hypothèses à propos de la distribution de troncature, à savoir si elle est complètement inconnue ou complètement connue. Alors que la première catégorie fait preuve de robustesse, la seconde est plus efficace lorsque les données peuvent supporter la forme de la distribution supposée pour la troncature. Motivés par des données sur le VIH/SIDA, les auteurs proposent un compromis en introduisant un estimateur semi‐paramétrique de la fonction de régression pour les données tronquées à gauche et censurées à droite. Ils supposent un modèle paramétrique pour la troncature, tandis que les distributions de la durée de survie et les covariables sont considérées comme inconnues. Ils adoptent une approche de pseudo‐vraisemblance locale pour développer leur estimateur en tenant compte du biais induit par le plan d'échantillonnage. Un cas d'intérêt porte sur l'estimateur de la fonction de régression pour les durées de survie biaisées par la longueur, le cas dit stationnaire. Les auteurs étudient les propriétés théoriques et les performances numériques des estimateurs pour des échantillons petits et grands. Ils illustrent finalement leur méthode d'estimat |
---|---|
ISSN: | 0319-5724 1708-945X |
DOI: | 10.1002/cjs.11580 |