TCGA癌症临床数据天然资源全面介绍---癌症研究领域的全谱!

2021-10-26 01:03 来源:商丘妇科医院

2006年,肝在此之前列脑瘤基因组研究成果(The Cancer Genome Atlas, TCGA)计划以多形功能性胶质母细胞会糙(GBM)、肺部柱状细胞会肝癌(LUSC)和生殖细胞浆液功能性囊腺肝癌(OV)开始为时3年的试点计划,2009年~2015年进一步展开。到计划年末,TCGA互联网研究者工来作者已再现了33种肝在此之前列脑瘤多种类型10,000余事例伤寒患的大分子形态,并界定了很多大分子HIV-。TCGA包括的流行伤寒学关键形态代详见时间推移的原始数据采集。为确保正确用于这些极具基因组形态的海量流行伤寒学原始数据,最近TCGA收尾一批重大成果,发详见在CellPress旗下的期刊。

本文对4月初5日发详见Cell上的一文顺利进行编译。文章阐释以OS(总适应环境期)、PFI(无成效每条)、DFI(无伤寒每条)和DSS(疾伤寒关的存活)为四个主要流行伤寒学结果起始站的TCGA蓝营肝在此之前列脑瘤流行伤寒学原始数据资源(TCGA-CDR)规范化原始文档,并假定了每种肝在此之前列脑瘤多种类型的起始站用于建言。TCGA流行伤寒学原始数据可从基因组原始数据共享生活空间(GDC)门户网站下载,所有的大分子原始数据在下载。流行伤寒学原始数据和大分子原始数据用于正因如此的条码结构上,便于伤寒患的流行伤寒学摘要和抽取大分子原始数据构建。

TCGA蓝营肝癌原始文档字段形态

所示1A为流行伤寒学原始数据构建和系统设计功能性方法及4个主要流行伤寒学起始站共通和检验的流程所示,对33份初始登记和97份后续原始数据文件,共33种肝在此之前列脑瘤多种类型111,60事例肝在此之前列脑瘤伤寒患的摘要顺利进行了执行。详见1为每个TCGA字段的基本形态。按原发抽取根据大分子形态选入每个字段,皮肤黑色素糙(SKCM)的原发和移不止灶两种多种类型都有,其它极极少数的原发与移不止多种类型也有研究者。

所示1. 流行伤寒学原始数据构建和系统设计功能性方法及4个主要流行伤寒学起始站共通和检验流程所示

详见1. TCGA 蓝营肝癌字段形态

流行伤寒学结果起始站OS、PFI、DFI和DSS

总适应环境期(OS)很关键性,实用性是界定OS重大事件时模糊功能性最低。但用于OS来作起始站可能会削减流行伤寒学研究者,因为非肝癌自杀身亡都是能反映不止生物体学、摧残功能性或对伤寒人缓解。用于OS或才可更慢的随访星期;很多流行伤寒学试验之在此之前,一般来说引入相对随访星期较短的DFI或PFI。针对原先TCGA流行伤寒学原始数据,要预见短时流行伤寒学随访每条在摧残功能性肝在此之前列脑瘤多种类型结果的关键性功能性,因为可能会几年内就注意到到流行伤寒学重大事件,在丧生在此之前已变成伤寒情罹患或成效。对摧残功能性较弱的肝在此之前列脑瘤多种类型,伤寒患在数十乃至几十年后罹患,随访期间可能会无法注意到所需重大事件以支在手可靠结果供判断。该系统设计功能性的意在是检查TCGA蓝营肝癌流行伤寒学侦测的相对军事优势和偏低,督导这两项的系统设计功能性和避免随访每条星期偏低等瑕疵。

系统设计功能性全部TCGA流行伤寒学原始数据后,论点如下:在原始数据可赢取时,OS、PFI及DFI相对准确,但相当多情况下只能大约DSS。所示1B为33种各不大致相同肝在此之前列脑瘤多种类型的OS K-M曲面。尽管适应环境系统设计功能性不是TCGA主要在此之前提,相当多肝在此之前列脑瘤多种类型适应环境曲面与依然检验大致相同适应环境起始站的法理研究者基本大致相同,GBM、OV(2008, 2011)和低级别胶质糙(LGG)(2015)的TCGA结果就是最不止色事例证。PFI、DFI和DSS的K-M曲面见所示1C–1E。

所示1 B-E流行伤寒学原始数据系统设计功能性

基于每种肝在此之前列脑瘤多种类型4个起始站的注意到星期计算最低随访星期及重大事件或检查的之在此之前位星期(详见2)。所有的之在此之前位随访星期为22.1个月初,但各不大致相同多种类型肝在此之前列脑瘤该星期区别巨大;GBM和急功能性髓系白血伤寒(LAML)最短约12个月初,而肾嫌色细胞会肝癌(KICH)最长约48个月初。

详见2 总体之在此之前位随访星期及4个起始站的重大事件与注意到之在此之前位星期

延揽用于的流行伤寒学结果起始站

流行伤寒学结果起始站慎重考虑取决于研究者在此之前提、重大事件数量、字段大小和结果原始数据数量级。将这些方法和开发的其它方法来作为对单个疾伤寒原始文档的验证和多余检查,假定在每种疾伤寒多种类型之在此之前用于每个结果起始站的建言及诱因(详见3)。每种肝在此之前列脑瘤多种类型的适应环境起始站无才可至极少通过一个主要验证和多余检查才被接受。33种肝癌之在此之前的13种用于全部4个起始站:食道尿路上皮肝癌(BLCA)、宫颈柱状细胞会肝癌(CESC)、结肠肝癌(COAD)、食管肝癌(ESCA)、头颈部柱状细胞会肝癌(HNSC)、肾状细胞会肝癌(KIRP)、肺部腺肝癌(LUAD)、LUSC、OV、胰腺肝癌(PAAD)、肉糙(SARC)、腹腔腺肝癌(STAD)和输卵管内膜肝癌(UCEC)。意味著,并没一个起始站的有嗜铬细胞会糙和副皮质糙(PCPG)。淋巴笼罩大B细胞会淋巴糙(DLBC)、LAML和颈腺糙(THYM)至极少一个起始站;只剩肝在此之前列脑瘤多种类型2或3个起始站,但其之在此之前一些在手意愿分歧。最可靠的是PFI,可无保留地延揽给除LAML(无原始数据)、DLBC和KICH(谨慎用于)和PCPG(不延揽)除此以外的4种。

详见3 起始站OS,PFI,DFI及DSS的检验与延揽用于

正确性TCGA-CDR及与此关的应用

在乳腺肝癌研究者之在此之前,雄激素ER形态功能性伤寒患流行伤寒学适应环境期预后比ER+伤寒患差。分别用OS、PFI、DFI和DSS来得这两类伤寒患的适应环境期(所示3A–3D;曲面年末于10年随访星期,但用于整个原始文档顺利进行系统设计功能性)。单诱因系统设计功能性显示,用于PFI(p= 0.005)和DFI(p = 0.001)来作为流行伤寒学起始站,TCGA之在此之前ER+乳腺肝癌伤寒患比ER-伤寒患有更好的适应环境期,但用于OS时两类伤寒患间不存有区别(p = 0.097) 。此除此以外,两类伤寒患的DSS(p = 0.009)有总体区别,详见明DSS的潜在价系数。以上挖掘不止断定了PFI和DFI是特定多种类型乳腺肝癌大分子研究者的合适起始站。

所示3 正确性和应用程序之在此之前

此除此以外还正确性了摧残功能性GBM适应环境结果起始站。TCGA之在此之前GBM之在此之前位OS为12.6个月初,介于此在此之前路透社的标准化伤寒人的12.1个月初和标准化伤寒人联合替莫唑胺的14.6个月初中间。之在此之前位PFI是6.1个月初,介于此在此之前路透社的标准化伤寒人5个月初和标准化伤寒人联合替莫唑胺的6.9个月初中间。似乎,TCGA原始文档OS和PFI重大事件星期与文献资料意味著。再次佐证OS和PFI来作为GBM大分子研究者的流行伤寒学起始站效度。

用Cox比重不断定功能性回归框架断定高期(III、IV期)相对低期(I、II期)肝在此之前列脑瘤伤寒患的不断定功能性比(HR),正确性4个起始站的TCGA-CDR原始数据。由于DFI界定与其它结果的界定不意味著,对延揽用于OS、PFI和DSS的14种多种类型肝在此之前列脑瘤来得logHR(详见3)。随后至极少对充分利用Cox比重不断定功能性理论上的疾伤寒顺利进行统计分析(所示3E–3G)。结果详见明,14种多种类型肝在此之前列脑瘤之在此之前,除间皮糙(MESO)、PAAD和葡萄膜黑色素糙(UVM)除此以外,高期对比低期HR在3个延揽起始站OS、PFI及DSS上明显极差。引入分组抽取的Wilcoxon秩和检验,当用于PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)准确测量时,logHR有总体区别,显示疾伤寒成效和适应环境起始站在HR上存有系统设计偏差;OS与DSS中间并没总体区别(p = 0.106)。对2个logHR系数的标准化误以为顺利进行逆标准化差断定Pearson关的系数, 由logHR大约的3种结果有极总体正关的:PFI和OS关的系数0.96(95%正态分布[CI]:0.77–0.99),PFI和DSS为 0.95(95%正态分布:0.76–0.99),OS和DSS为0.90(95%正态分布:0.61–0.98)。这些关的功能性潜在支在手流行伤寒学一时期用PFI,后期用OS和DSS好好起始站。

除了构建大分子原始数据,还尝试系统设计功能性首次伤寒人后无伤寒伤寒患与非无伤寒伤寒患确实变成各不大致相同的新重大事件。TCGA-CDR之在此之前29类肝在此之前列脑瘤讯息用于消除该关键问题,纳入伤寒患从确诊到收尾首治并达到无伤寒只不过至极少存活3个月初。以LUSC为事例,有289事例无伤寒伤寒患和41事例近十年非无伤寒伤寒患,NTE不下分列21.8%和68.2%。用Cox比重不断定功能性回归框架,挖掘不止在非无伤寒伤寒患之在此之前NTE不断定功能性总体极少于无伤寒伤寒患(HR = 6.68,95% CI = 4.25–10.51,FDR缩减q系数<0.05)。在另除此以外21种肝在此之前列脑瘤多种类型之在此之前也有相近结果(详见4)。都已7种之在此之前并没注意到到这些区别。我们也在检验确实每个框架都充分利用比重不断定功能性理论上,其之在此之前有两个不符合,无才可研究者星期倚赖及多函数框架来寻找诱因。

详见4 非无伤寒与无伤寒伤寒患NTE转变对比

TCGA从全球数百个线路采集伤寒事例,为消除流行伤寒学原始数据各不大致相同线路间的可比功能性,才可慎重考虑原始数据基本功能性、和伤寒患形态等。对每种疾伤寒而言,我们对比了在此之前两名包括伤寒事例数最多的组织来源线路(TSS)与所有其它TSS的同种疾伤寒及4个结果起始站(详见5)。

详见5 对来自在此之前两位TSS的每个肝在此之前列脑瘤多种类型研究者结果顺利进行来得

对于GBM等极极具摧残功能性的,在此之前两位TSS(#1和#2)的发伤寒一些人与其它TSS相对于相近的有OS、PFI和DSS,因重大事件太极少难以系统设计功能性不延揽DFI好好起始站。BRCA等较低摧残功能性,强而有力延揽用于PFI和DFI,但建言谨慎用OS或DSS检验。TSS #1的流行伤寒学原始数据诱发不太好的OS和DSS,但并没注意到到PFI区别;另除此以外,详见面上TSS#1有更好的DFI结果,至极少变成3事例 DFI重大事件。这种详见里不一的物理现象详见明该线路的结果原始数据才可必要性检验。另一多方面,TSS #2的4个起始站结果与其它地方意味著。

这个简单的结果来得详见明,当从特定结果系统设计功能性整体TCGA的流行伤寒学原始数据时,无才可慎重考虑TSS的说明讯息。由于成年人、分期/分级及伤寒人等诱因严重影响各不大致相同TSS患伤寒一些人的起始站结果,TSS可以来作为这些和不只不过流行伤寒学译文等其它没准确测量区别的替代。

潜在的或多或极少诱因、市场竞争结果的

不断定功能性及框架理论上

对流行伤寒学适应环境起始站系统设计功能性来说,建言用于所执行的全部流行伤寒学原始数据。但相对于大分子/基因组原始数据的构建系统设计功能性,要注意两个多方面。首先,延揽意愿基于水平线适应环境框架,以大分子HIV-来作统计学遗传物质拆分抽取集,确实会摧残结果统计分析的总体功能性区别。因此,从互关的连功能性的TCGA大分子原始数据或HIV-TCGA-CDR结果原始数据之在此之前得不止的论点才可在法理的原始文档之在此之前必要性断定。

第二,我们建言至极少用于原发的大分子原始数据,因为伤寒患初诊时,关键性星期讯息等匹配的流行伤寒学原始数据已采集相对基本。皮肤黑色素糙(SKCM)在TCGA多种类型之在此之前极为特殊,470事例之在此之前至极少103事例原发,其余296事例为原发区域内呼吸道移不止,68事例启动时移不止。这与很极少采集到移不止糙的其它TCGA肝在此之前列脑瘤多种类型形成鲜明对比。SKCM移不止糙很极少极具有匹配的原发,而其它TCGA肝在此之前列脑瘤多种类型尽管很极少有移不止糙,但都极具有匹配的原发抽取。因此,对于SKCM结果的关的功能性,建言只用于有限数量的原发伤寒事例,尽管SCKM呼吸道移不止的III期伤寒事例可来作为法理两大顺利进行研究者。

在用于新构建的TCGA-CDR原始文档时,还无才可注意:潜在混淆诱因、市场竞争结果的不断定功能性及框架理论上。

或多或极少诱因

或多或极少诱因存有但被排除在框架之除此以外时,偏差可能会显然或低估真实。如在乳腺肝癌的种族区别研究者之在此之前,白人与有色人种伤寒患中间存有关键性的基因详见达区别,然而根据大分子HIV-顺利进行缩减后,这种区别总体减极少甚至变成。治果也是潜在的或多或极少诱因,当讯息可获取时应适当慎重考虑缩减。伤寒人没知时,成年人、诊治医院及确诊年份等标准化伤寒人来作为替代讯息能减极少部分误以为差。对这多方面的决策建模,鼓励用于标志物预后研究者建言简报(REMARK)。

市场竞争结果的不断定功能性

测定DSS、DFI和PFI起始站时,要对并没经历关键性重大事件且无伤寒的丧生伤寒患顺利进行甄别。在这种情况下,如果理论上伤寒患并没其它自杀身亡,那她/他事与愿违仍可能会死于肝在此之前列脑瘤指征。然而,在大约伤寒人等统计学遗传物质对继发功能性肝在此之前列脑瘤或心血管疾伤寒等非比率肝在此之前列脑瘤丧生不断定功能性的统计学能力时,该理论上并不可取。

框架理论上

应用Cox比重不断定功能性(PH)框架必须检查PH理论上。都有与此关的除此以外,大相当多框架都充分利用Cox PH理论上,但才可必要性追寻这些医疗事故以找不止违背理论上的诱因,从而对HR好好不止更准确的大约。尽管早已为清理原始数据和消除关键问题付不止了很大努力指导工作,但仍存有关键性的用于容许,采访TCGA流行伤寒学原始数据都必须探究这些容许。

首先,TCGA主要是为大分子研究者设计,本来伤寒事例慎重考虑来自多个机构极具有合适只剩组织的没伤寒人原发伤寒事例,因此这些伤寒事例不构成连续功能性。此除此以外,对于每种各不大致相同多种类型/研究者,随访原始数据并没统一采集。同时,流行伤寒学原始数据采集的一些规则在依然只得随着星期的推移而改变。TCGA - CDR不包括肝在此之前列脑瘤伤寒人历史学者,并非所有伤寒事例都被译文。因此,系统设计功能性特定多种类型或HIV-的伤寒人背景优于概要功能性蓝营肝癌系统设计功能性。当伤寒患顺利进行说明伤寒人时,受惠能用DFI和PFI起始站有效系统设计功能性。

其次,TCGA抽取流行伤寒学随访根据当地诊所的星期详见,可能会为疾伤寒或特定手部的罹患和伤寒人关键性生命只不过的记录,因此并没TCGA指定的流行伤寒学随访计划,至极少假定计划主要忽略的大分子形态。

最后,几乎所有TCGA赢取的抽取和基因组及大分子原始数据来自新诊伤寒患原发的单个除此以外皮,由此诱发的基因组和大分子原始数据很难在生活空间或星期任何多方面指明俘获代详见另一伤寒患结果函数的异质功能性。该关键问题不是TCGA独有的,任何静态原发功能性研究者都存有。

展望

这项工来作是有历史学者以来第一次进一步系统设计地执行TCGA蓝营肝癌流行伤寒学摘要。由此诱发的TCGA-CDR的结果起始站与法理非TCGA研究者结果意味著,指明指不止该资源在不小规模的流行伤寒学宏观上包括了生物体观测新视角。也要预见TCGA-CDR的内在用于局限功能性及关键功能性督导和延揽意愿。早已极为明晰,人类疾伤寒愿景大规模的大分子研究者必须系统设计地采集流行伤寒学伤寒理、伤寒人和原于重大事件原始数据,以坚在手最高标准化的流行伤寒学研究者。尽管有其局限功能性,TCGA-CDR包括了规范化原始文档,以及清晰的4个流行伤寒学结果起始站推,并消除了数量级关键问题,从而在蓝营肝癌和生物体体水平上顺利进行转化研究者。愿景原始数据研究者的融汇将提高结果中间的可比功能性,更好地推论和支在手减法。

参考摘要

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
44岁月经18天不走,B超见到宫腔里面多长了一块“肉”
44岁的雨皖(密友)因为同年经淋漓不尽18天求诊。询问病因,我了解到雨皖最近2年的同年经周期23~30天,经期5~6天,经使用量中等。末次同年经自2020年...[详细]
2022-05-10
月经不规则出血是什么因素 哪些因素会导致月经不调
从成年开始长期以来到绝经期之前,更年期都才会伴随着异性恋,与此同时更年期多会也众所周知她们身体的“晴雨表”一般,仔细观察更年期是否有极...[详细]
2022-05-05
速看┃这些跟上环中有关的事儿,你还不知道吗?
上外环,医学上叫宫内节育器,为用药被放入到内膜里面来进行用药的工具之一。用药的方式有很多种,如避、用药、节育手术等等。而上外环是涵盖在...[详细]
2022-05-04
雌二醇低怎么调理
男同性恋眼睛内的雌性激素可以促进器官组织正常愈合,以及促成排卵。当男同性恋发现自己眼睛;还有带有的雌性激素过极低以后,一定要导致警惕,...[详细]
2022-05-03
月经不调的危害 咳嗽竟是这个问题导致
排卵期不调是有很多侵害的,这点可能有些人还不洞察吧!排卵期不调的因素有很多,当排卵期不调相对严重的时候,可能避免身体的其他部位也受到受...[详细]
2022-05-02
月经不调 8大症状崇你识别月经不调
妇科疾病始终担忧着很多芭比,而且妇科疾病也始终都是社会各界关注的焦点。其中受精期不调是为常见的一种。那么,如何识别和疗法受精期不调呢?现...[详细]
2022-05-02
月经不调的疼痛 8个表现帮你认清大姨妈
女人你是否元月有规律不表征?元月推迟或原定了呢?那就有可能是元月不调了哦。女人每月一次的元月应该以28天左右为一个有规律,如果这个有规律时不...[详细]
2022-04-28
《柳叶刀》影中国死胎率,竟然高达41.90%!黑得好厉害!
MedSci小编评论:此文一出,惊天动地!中所国医务人员和医生又被红了!这中所间关键在于如何定义?在的西方,很多地方都不准无疾而终!而在中所国...[详细]
2022-04-27
互联网医疗十大焦点事件有关单位|2016年年度有关单位
2016年不太可能相似尾声,对于门户网站际门户网站路戍生来说,2016是不寻常的一年。从戍生进行改革国策,到门户网站际门户网站路医务管理人员,医...[详细]
2022-04-26
  • 地区医院
  • 医院联盟