潘金清,湯佳馨,周佳敏,沈小媛,葉祥生,譚筱江
(南方醫科大學南方醫院 a.惠僑醫療中心;
b.呼吸與危重癥醫學科,廣州 510515)
肺癌是世界范圍內造成癌癥相關死亡事件的主要原因[1]。非小細胞肺癌是肺癌的主要組織學類型,占肺癌病例的85%以上[2],具有高轉移和高復發的特點,包括以下4個亞型:肺腺癌、肺鱗狀細胞癌(LUSC)、大細胞癌和肺神經內分泌癌,其中LUSC約占所有肺癌病例的30%[3]。目前LUSC的主要治療方式包括手術、化療、放療、免疫治療和靶向治療等[4]。盡管肺癌的預防、診斷和治療已經取得了較大進展,但肺癌患者的5年總生存率僅為19%[5]。
細胞焦亡是一種促炎形式的程序性細胞死亡,有大量研究表明焦亡過程在腫瘤發生和腫瘤治療中起著關鍵作用,包括肺癌在內的多種腫瘤對誘導焦亡的治療手段均敏感[6]。近年來,LUSC與長鏈非編碼RNA(lncRNAs)之間的聯系越來越受到重視。lncRNAs指長度超過200個核苷酸而不具有蛋白編碼能力的RNA,其參與多種細胞活動,如脂肪生成、細胞凋亡、細胞焦亡、細胞分化、表觀遺傳修飾、腫瘤發生和調控等[7]。已有研究[8]表明lncRNAs與膀胱癌、胃癌、卵巢癌、非小細胞肺癌等多種癌癥的發生發展密切相關。lncRNAs在非小細胞肺癌中調控細胞焦亡的作用也被證實[8],但焦亡相關lncRNAs在LUSC中的作用仍有待探索,LUSC患者治療或預后中涉及的焦亡相關lncRNAs尚不明確。
本研究通過生物信息學分析篩選肺鱗癌患者中具有預后價值的焦亡相關lncRNAs,并用于構建基于焦亡相關lncRNAs的預后風險評估模型,以期為肺鱗癌患者的預后預測提供參考。
LUSC患者的RNA轉錄組數據、臨床信息均從TCGA數據庫(https://portal.gdc.cancer.gov/)獲取,只將隨訪信息完整的樣本納入分析。通過檢索相關文獻獲得52個與焦亡相關的編碼基因(mRNAs)[9]。經Pearson相關性分析計算焦亡相關基因表達量與差異lncRNAs相關性,以相關系數絕對值>0.4為焦亡相關的lncRNAs。再對所得焦亡相關的lncRNAs進行Pearson相關分析(|log2 Fold Change|>1,FDR<0.05),獲得焦亡相關的差異lncRNAs。
通過GSEA分析比較高、低風險2組間的KEGG通路差異。從TIMER2.0中下載免疫細胞浸潤數據,采用R包(limma、GSVA、GSEABase、ggpubr、reshape2)進行分析,比較高、低風險2組間免疫細胞和免疫功能差異;
使用limma比較高風險組和低風險組在免疫檢查點和m6A相關基因方面的差異。以P<0.05為差異具有統計學意義。
Pearson相關性分析鑒定出743個焦亡相關的lncRNAs,對焦亡相關lncRNAs進行差異分析(logFC>1;FDR<0.05),得到277個焦亡相關的差異lncRNAs。單因素Cox生存分析顯示,21個焦亡相關lncRNAs與肺鱗癌患者的總生存率相關(P<0.05),包括LINC02555、PICART1、AC011511.5、MYOSLID、AC007823.1、AL136369.1、LANCL1-AS1、AP001189.1、AP001189.3、MIR3945HG、AL357054.4、LRRK2-DT、LINC01322、AC010422.4、AC112722.1、AL122125.1、AP001528.1、LINC02345、AC104248.1、AL606469.1、SFTA1P(圖1)。進一步對上述21個lncRNAs進行多因素Cox生存分析,最終獲得8個與預后相關的焦亡相關lncRNAs:PICART1、MIR3945HG、LINC01322、AC010422.4、AC112722.1、AL122125.1、AC104248.1、SFTA1P。
圖1 21個與肺鱗癌患者的總生存率相關的焦亡相關lncRNAs
根據焦亡相關lncRNAs的表達及其相應的風險系數,計算每位LUSC患者基于該模型的風險評分。風險評分=PICART1×0.525 752 425+MIR3945HG×0.522 857 7+LINC01322×0.152 951 022+AC010422.4×(-1.180 751 205)+AC112722.1×0.713 017 253+AL122125.1×(-0.245 646 317)+AC104248.1×0.132 707 153+SFTA1P×(-0.016 397 794)。以風險評分的中位值(0.99)為閾值,將LUSC患者分為高風險組和低風險組,分別為246例和247例。Kaplan-Meier生存分析顯示,高風險組半數總生存期為3年,而低風險組半數總生存期為6年,為高危組的2倍(圖2),低風險組的總生存期明顯優于高風險組(P<0.001)。風險曲線表明高風險組患者的生存狀態較差(圖3A—B)。熱圖顯示LUSC預后相關的8個焦亡lncRNAs在2組患者中表達量有明顯差異,其中高風險組PICART1、MIR3945HG、LINC01322、AC112722.1、AC104248.1、SFTA1P的表達較低風險組顯著上升,而AC010422.4、AL122125.1表達明顯下降(圖3C)。
圖2 Kaplan-Meier生存分析
Patients(increasing risk socre)
Patients(increasing risk socre)
A:各樣本風險評分散點圖;
B:各樣本生存狀態散點圖,綠色點表示生存,紅色點表示死亡;
C:高、低危組8個焦亡相關lncRNAs表達水平熱圖。
將患者臨床特征和風險評分結合進行單因素Cox分析,結果顯示風險評分是LUSC患者的預后因素(P<0.001,圖4A)。進一步將風險評分納入多因素Cox分析,結果表明上述基于焦亡相關lncRNAs的風險評分可作為LUSC患者的獨立預后因素(圖4B)。ROC曲線顯示1、2、3年生存率AUC值分別為0.632、0.643、0.645,說明風險模型預測患者預后的準確性尚可(圖5A),且焦亡相關lncRNAs預后模型優于年齡、性別、分期等預測指標(圖5B)。熱圖展示了高、低風險組焦亡相關lncRNAs、年齡、性別、分期等的分布情況(圖6)。
A:單因素;
B:多因素。圖4 臨床特征和基于焦亡相關lncRNA的風險評分的Cox回歸分析
A:基于焦亡相關lcnRNAs的1、2、3年生存率預測;
B:基于焦亡相關lncRNAs、年齡、性別、分期的1年生存率預測。
圖6 焦亡相關lncRNAs和臨床特征相關熱圖
GSEA分析顯示,高風險組差異基因富集于ECM受體相互作用通路(圖7A),而低風險組在剪接體和藥物代謝細胞色素P450通路富集(圖7B)。
A:高風險組;
B:低風險組。圖7 KEGG通路富集分析
用TIMER、CIBERSORT、CIBERSORT-ABS、QUANTISEO、MCPCOUNTER、XCWLL、EPIC等數據庫對高低風險組進行免疫細胞浸潤情況分析,結果顯示高風險組患者免疫細胞浸潤豐度比低風險組高,如B細胞、CD4+T細胞、CD8+T細胞、中性粒細胞、巨噬細胞和NK細胞(圖8A)。進一步對高、低風險組的免疫功能(圖8B)及免疫檢查點(圖8C)進行比較,高風險組的APC共抑制分子、APC共刺激分子、趨化因子受體、免疫檢查點、細胞活性、人類白細胞抗原、促炎因子、組織相容抗原、副炎癥、T細胞共抑制、T細胞共刺激、Ⅰ型及Ⅱ型IFN應答免疫功能更強。
m6A是最豐富和可逆的RNA修飾,可以調節lncRNA的表達和生物學效應,m6A相關的lncRNA修飾在腫瘤診斷、治療和預后中表現出出色的應用前景[12]。通過分析m6A相關基因在2組間的表達差異,發現m6A相關基因中HINRNPC、METTL3、YTHDC2、YTHDC1在高風險組中表達下降,而FTO、YTHDC1在高風險組中表達顯著上升(圖8D)。
A:免疫細胞浸潤;
B:免疫功能;
C:免疫檢查點;
D:m6A相關基因。*P<0.05,**P<0.01,***P<0.001,ns P>0.05。
LUSC是肺癌最常見的組織病理類型,多發生于男性,與吸煙有關。高敏感性和高特異性的指標的缺乏使得LUSC的早期診斷較為困難[13]。隨著對LUSC認識的加深,新的預后相關指標可為LUSC患者的治療及評估預后提供新的策略。焦亡被認為是一種新的細胞死亡途徑,近期有研究表明焦亡相關的lncRNAs有可能成為膀胱癌[14]、肺腺癌[6]、子宮內膜癌[15]、頭部鱗狀細胞癌[16]、骨肉瘤[17]等癌癥的潛在分子標志物和治療靶點。LI等[18]研究發現3個與LUSC焦亡相關的編碼基因,但尚未有文獻報道焦亡相關lncRNAs與LUSC的關聯。lncRNAs存在于血液中故易于檢測,可避免穿刺活檢等帶來的創傷[19]。而傳統的肺腫瘤標志物如CEA、CA125、CYFRA21-1等的診斷價值有限[20],因此,lncRNAs也有望成為肺癌早期診斷的標志物。
本研究利用已有數據庫獲取LUSC患者的轉錄組測序數據及其臨床信息,構建了由8個lncRNAs(PICART1、MIR3945HG、LINC01322、AC010422.4、AC112722.1、AL122125.1、AC104248.1、SFTA1P)組成的預后預測模型。有文獻報道PICART1可促進細胞凋亡和降低細胞活力,具有抗肺癌的作用[21];
MIR3945HG被認為在LUSC預后中有很高的診斷價值[22];
SUN等[23]研究表明LINC01322可作為LUSC的獨立危險因素;
WENG等[12]研究發現AL122125.1是影響LUSC患者預后的獨立因素;
FTA1P也是影響LUSC預后的重要lncRNAs[24],LI等[25]研究顯示SFTA1P可提高LUSC對順鉑的敏感性,可作為預測LUSC患者化療反應和預后的生物標志物。
依據基于lncRNAs的風險評估模型的高、低風險組生存分析結果顯示高風險組患者預后顯著低于低風險組,且單因素和多因素Cox分析顯示風險評分可以作為獨立預后因子。KEGG富集分析發現高風險組在ECM受體相互作用通路富集,而ECM受體相互作用通路已被證實在前列腺癌、胃癌、膠質母細胞瘤、肺癌中表達異常,并參與腫瘤細胞的轉移和浸潤[26]。高風險組免疫細胞的浸潤和功能比低風險組更為活躍。
腫瘤細胞的浸潤、免疫功能以及免疫檢查點抑制分子的表達可以影響腫瘤患者的預后,并預測免疫治療的效果[27-28]。免疫浸潤分析結果顯示,高、低風險組在免疫細胞浸潤、免疫功能、免疫檢查點等方面的表達存在顯著差異。進一步對m6A相關基因進行分析,發現高風險組中m6A相關基因HNRNPC、METTL3、YTHDC2、YTHDC1表達顯著下調,而FTO表達顯著上調。這與WENG等[12]的結果有相似之處。
本研究也存在一些局限性:一是所有數據均來源于數據庫,未進行外部數據集驗證;
二是對于8種焦亡相關的lncRNAs在LUSC發生發展中的分子機制聯系未做進一步的研究和闡述??傊?,本研究通過生物信息學的方法初步探討了焦亡相關lncRNAs與LUSC預后之間的關系,篩選出了8個lncRNAs可能與LUSC的預后相關,為研究細胞焦亡與LUSC之間的關系提供了新的方向。