Loading…

基于长链非编码RNA的生物信息学分析构建膀胱癌预后模型并确定预后生物标志物

R737.11; 目的:构建基于长链非编码RNA (long non-coding RNA,lncRNA)的膀胱癌预后模型,并寻找预后生物标志物.方法:从癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库下载膀胱癌转录组及临床数据,Perl软件和R软件用于数据处理和分析.首先筛选差异表达lncRNA,继而对筛选结果进行单因素Cox回归分析以初步筛选与预后相关的lncRNA,再进一步用Lasso回归分析筛选影响预后的关键lncRNA,并运用多因素Cox回归分析构建预后模型.根据风险评分的中位数将患者分为高风险组和低风险组,运用Kaplan-Meier(K-M)生存分...

Full description

Saved in:
Bibliographic Details
Published in:北京大学学报(医学版) 2019, Vol.51 (4), p.615-622
Main Authors: 杨飞龙, 洪锴, 赵国江, 刘承, 宋一萌, 马潞林
Format: Article
Language:Chinese
Online Access:Get full text
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:R737.11; 目的:构建基于长链非编码RNA (long non-coding RNA,lncRNA)的膀胱癌预后模型,并寻找预后生物标志物.方法:从癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库下载膀胱癌转录组及临床数据,Perl软件和R软件用于数据处理和分析.首先筛选差异表达lncRNA,继而对筛选结果进行单因素Cox回归分析以初步筛选与预后相关的lncRNA,再进一步用Lasso回归分析筛选影响预后的关键lncRNA,并运用多因素Cox回归分析构建预后模型.根据风险评分的中位数将患者分为高风险组和低风险组,运用Kaplan-Meier(K-M)生存分析、受试者接受特征(receiver operating characteristic,ROC)曲线和C指数对模型进行评价.此外,运用多因素Cox回归分析计算预后模型中各lncRNA的危险比和95%置信区间,并对差异有统计学意义的lncRNA进行K-M生存分析以确定预后生物标志物.结果:单因素Cox回归分析显示,在691个差异表达的lncRNA中,35个可能与预后相关,其中23个经Lasso回归分析确认为影响预后的关键lncRNA.此外,K-M生存分析结果显示低风险组的总生存时间较高风险组长[(2.85±2.72)年vs.(1.58±1.51)年,P<0.001],ROC曲线显示3年生存率和5年生存率的曲线下面积分别为0.813和0.778,C指数为0.73.多因素Cox回归表明,23个关键lncRNA中有11个lncRNA差异有统计学意义,进一步的K-M生存分析表明,其中有3个lncRNA可能具有独立的预后价值,包括lncRNA AL589765.1(P=0.004),AC023824.1(P=0.022)和PKN2-AS1 (P=0.016).结论:通过生物信息学分析,成功构建了基于23个lncRNA表达水平的膀胱癌预后模型,预测准确性中等,并确定了一个保护性预后生物标志物AL589765.1,以及两个不利的预后生物标志物AC023824.1和PKN2-AS1.
ISSN:1671-167X
DOI:10.19723/j.issn.1671-167X.2019.04.003