GEN预测:2015年全基因组测序(WGS)6大应用
Illumina宣布HiSeq X Ten测序系统将会于1月份重磅回归,该技术的早期运用还需要等待一段时间,然而GEN预测了Illumina X Ten在2015年可能会实现的6大应用。Illumina X Ten的测序功能非常强大,一台机器一年能完成18000个人类基因组测序,尽管大规模基因组测序还会面临一系列挑战,但是现在可以将这些顾虑暂时搁置,思考一下科学家们可以利用该技术完成哪些有趣的工作呢?下面就是GEN预测的6大应用。
新生儿重症监护病房和儿童医院每年都会收治大量患有严重疾病的患儿,而其中很多致命的疾病都存在其遗传基础。其中有一些是已知的遗传疾病,能够通过临床基因检测确诊。然而还有大量的疾病无法通过基因检测查出来,却严重地影响儿童健康。目前有很多试点计划,像是NIH的“未确诊疾病计划”就是通过外显子测序来实现检测,外显子测序平均能揭示25—30%的病理性突变。
然而,全基因组测序能够发现难以捕捉的外显子区域,还能够发现结构性变异。随着X Ten system的应用,全基因组测序只是下面要做工作的第一步。它的运转速度更快,不需要杂化反应,检测范围能从单一核苷酸变异到大片段丢失。如果可行的话,患者及其父母,甚至是兄弟姐妹都可以进行全基因组测序。
基因研究的一个巨大前景就是实现个体化医疗:把治疗疾病具体到每个个体的基因组成上来。实现个体化医疗需要研究疾病预后和药物反应的个体基因差异,目前许多药物基因组计划正在进行,而很多都是运用SNP分析和靶向测序技术。全基因组测序能够更好地促进这些工作,因为全基因组测序能够捕获范围更广的变异。全基因组测序还能够运用到临床试验的前沿,它可以将病人按反应分成很多群体进行研究。
国际人类基因组单体型图计划(HapMap Project)的一项重要开支就是从成纤维细胞系中鉴定出基因变异,该项工作由Coriell领头。获得所有SNP基因型后,研究人员可以分析基因表达,最初是通过芯片分析,后来通过RNA-seq技术,最终将这些结果与变异联系起来。这些分析结果产生了成千上万的表达数量性状基因座(eQTLs),分析这些数据可以了解基因变异影响转录的方式。
可以想象用最先进的RNA-Seq和 WGS(全基因组测序)技术对同一样本进行分析后会得到怎样强大的数据(RNA-seq是在另外一些平台上做的,比如Hiseq2000,因为X Ten只能进行全基因组测序)。ENCODE Project Consortium和其他几个团队揭示了转录广泛发生的方式,毫无疑问,仅仅利用过去的SNP芯片分析是无法得出这些结论的。
癌症基因组图谱(TCGA)和国际癌症基因组计划(ICGC)等工作鉴定出大量癌症类型的体细胞突变。大多数工作是通过外显子测序和全基因组测序完成的,而鉴于成本考虑,主要是外显子测序。尽管如此,这些工作极为有效地揭示出反复出现的变异和通路。
然而,这些工作主要是基于那些常见的肿瘤类型。不过随着全基因组测序的普及,那些罕见的肿瘤类型也可以通过同样的手段进行研究。通过把TCGA、ICGC和其他数据库的样本作为比对参照,我们可以获得许多罕见肿瘤的体细胞变异数据。这不仅可以帮助那些患罕见瘤的病人,而且可以帮助深入理解生物学中的特异性。
全基因组测序是研究这些罕见肿瘤的极为有效的工具,基于我们对这些肿瘤了解甚少,通过全基因组测序可以捕获到所有的变异,在一次测序中小到可以获知单核苷酸位点的变异,大到染色体重排。将全基因测序大规模应用在肿瘤研究中,也是理所当然了。
这一点和第一条应用(新生儿与儿科疾病预测)看起来可能很相似,但其实是另一种研究,需要挖掘受家族性遗传疾病影响的多谱系病因。家族性研究和病例对照研究比起来可能有点过时,但是目前这种研究方法重又回到研究者视线,其中非常重要的一点原因就是在具有不同等位基因的一个家族内部研究变异,而不是在毫不相关的个体之间进行研究。
然而,全基因组测序和病例研究相比成本过高,在一个家谱中,研究者可以运用连锁分析,但是仍然需要通过测序来确定造成疾病的特定变异。这时候全基因组测序的优势就会体现出来,它使得研究者可以了解连锁区域的非编码和结构变异,而不是单纯的探究基因变异。这一点非常重要,随便问一个基因研究人员,他会告诉你在研究区域内的大量相关峰值都和已知的基因无关。这样的例子可谓是数不胜数。
那些表型广泛的群组样本通常非常需要基因型研究,过去通常是利用SNP分析和外显子测序的方法进行研究,随着群体参与研究样本和表型数量的增长,研究群组会扩大。这时候对复杂多样的表型进行大规模的、纵向的研究对确认潜在基因非常重要。
HiSeq X Ten问世后,全基因组测序对于一个样本数量为10000的群组来说仍然成本过高,然而对于一个样本量为200、500或1000的预实验来说还是简易可行的,并且能够发现在大规模群组中可以复制的结果。研究人员可以挑选出具有最广泛表型(生物标记物、临床数据、RNA-seq、健康记录)的小样本,然后结合全基因组测序研究它们之间的关联。
除了以上提出的研究领域之外,X Ten system还可以在很多领域大有可为,需要研究者继续挖掘。