cfDNA分子(cell-free DNA,血浆游离DNA或无细胞DNA)在疾病的筛查、诊断和治疗监测等方面具有重要的临床价值,可应用于无创产前检测(NIPT)和肿瘤分析等。
在NIPT的应用中,从孕妇血浆样本中获得的胎儿cfDNA分子长度往往较短,多在167bp上下。常用的Illumina测序平台读长稍短,在150-500bp。有关500bp以上cfDNA片段的数据少之又少。
在此长度上,能获取的遗传信息(如SNP)和表观遗传信息(如CpG)极为有限。因为SNP或CpG位点通常与其最近的SNP或CpG位点相隔数百或数千个碱基对。因此,想通过短cfDNA分子进行检测分析,难度很大。
那么,血浆样本中是否存在长片段cfDNA分子呢?

图源:PNAS官网
南方医学网讯:12月14日,卢煜明团队在PNAS上发表了题为“Single-molecule sequencing reveals a large population of long cell-free DNA molecules in maternal plasma”的文章1,似乎为解答这个问题提供了新思路。
研究团队通过单分子实时测序(SMRT,第三代测序技术的一种)在母体血浆中发现了大量长cfDNA分子,并观察到最长的cfDNA分子达到了23,635 bp。这表明,单分子实时测序能克服短测序技术的检测限制,比短cfDNA分子更广泛有效地解码嵌入其中的遗传信息和表观遗传信息。

图源论文:研究设计概述
研究发现,血浆中的长cfDNA分子显示A或G 5′片段末端占优势。此外,有无先兆子痫孕妇的cfDNA分子表现出不同的末端基序谱。例如,先兆子痫母体中的长cfDNA分子减少,末端基序主要以T或C结尾;而无先兆子痫的主要以5′末端的G或A结尾。
由此,检测分析长cfDNA分子或为区分有无先兆子痫孕妇的诊断新途径。
该研究还利用不同测序平台分析母体血浆DNA分子的大小分布。使用SMRT测序分析妊娠晚期孕妇的血浆DNA样本,绘制了320万个的环形一致性测序(CCS,circular consensus sequences)模式,结果显示大于200 bp、500 bp、1 kb和3 kb的cfDNA分子分别占53.7%、35.8%、22.0%和3.8%。(如下图)

图源论文:不同测序平台的母体血浆DNA分子大小分布
由图可见,与Illumina HiSeq(短读长测序)相比,PacBio SMRT测序检测到的长cfDNA比例高出1000倍。
一般来说,与短cfDNA分子相比,长cfDNA分子含有更多的CpG位点。此前,研究团队基于SMRT已开发了被称为“整体动力学(HK)模型”(HK模型)的新方法2,可确定血浆DNA分子上每个CpG位点的甲基化状态,并进行分析,确定其组织来源。
该方法实现了5-甲基胞嘧啶(5mC)的全基因组检测,无需任何化学或酶转化,也不需要在测序前进行PCR扩增,可直接应用于天然DNA,或为肿瘤分析等分子诊断应用开辟更多新的可能。

图源论文:长cfDNA分子的组织来源分析
通过SMRT测序对从7名孕早期孕妇(胎龄:12 6/7至13 6/7周)、妊娠中期10名孕妇(胎龄:17至22 5/7周)和11名妊娠晚期(胎龄:38至38 3/7周)的血浆样本中提取的cfDNA分子进行测序,发现共计800万、1810万和1620万个cfDNA分子。其中,500 bp以上的cfDNA比例分别为:孕早期15.5%、孕中期19.8%、孕晚期32.3%。显然,孕晚期母体血浆样本的cfDNA分子比例更高。

图源论文:不同孕期cfDNA分子的大小分布
卢煜明团队表示,目前的研究工作证明了大量以前未被探索的长cfDNA分子的存在,将为克服这些技术挑战创造动力,为单基因疾病的无创产前检测及潜在临床应用开辟探索途径。
同时,该研究也存在局限:研究样本数量有限,如对血液样本cfDNA分子进行测序的孕妇样本数为28例;病例中缺少父系单倍型信息,而是通过定量分析两种母体单倍型之间的不平衡情况,确定胎儿的母系遗传;组织来源的分析准确性没有达到100%,但可能通过基于电泳、磁珠法或富集长DNA分子等技术加以改进;目前PacBio SMRT测序通量相对较低,使其临床实施面临着成本的挑战。
这篇研究再次将大家的注意力聚焦于NIPT。而被称为“NIPT奠基人”的卢煜明教授也并未满足于已有成绩,不断尝试,探索着NIPT以及液体活检的想象空间,那里似乎还没有天花板。
篇幅有限,更多详情,请阅读原文。
参考资料
1、https://www.pnas.org/content/118/50/e2114937118.long
2、https://www.pnas.org/content/118/5/e2019768118?ijkey=d6bfdc49d284989ab4742295b14575e3d6f14e73&keytype2=tf_ipsecsha