#基因检测产品的诞生之初#
膀胱癌是指发生在膀胱黏膜上的恶性肿瘤,是泌尿系统最常见的恶性肿瘤之一。在我国,其发病率位居泌尿生殖系肿瘤首位,年全球膀胱癌新发病例,例,死亡病例,例,分别占癌症发病和死亡总数的3.0%和2.1%,其中男性膀胱癌的发病率(9.5/10万)和死亡率(3.3/10万)均为女性(1.7/10万和0.47/10万)的3~4倍(Sungetal.,CACANCERJCLIN,)。
通过早筛早诊可以明显地提高膀胱癌肿瘤患者的生存时间和生存质量。早期膀胱癌的治疗主要以膀胱根治术为主,术后根据病理类型和免疫组化结果进行卡介苗膀胱灌注或者化疗等治疗,晚期膀胱癌主要以保守治疗为主。据统计,70%的膀胱癌患者治疗后会发生复发,所以需要进行长期的周期性复发监控,人均终身治疗费用很高(膀胱癌在欧美是人均经济负担最高的肿瘤),所以可及的膀胱癌的早筛早诊和复发监控技术十分重要。
尿液是膀胱癌液体活检的好材料。在癌症患者的体内,肿瘤细胞通过凋亡、坏死或者主动释放了DNA到体液中形成细胞游离DNA(cellfreeDNA,cfDNA),这种cfDNA称为循环肿瘤DNA(circulatingtumorDNA,ctDNA)。由于膀胱特殊的生理结构,尿液与病灶直接接触;容易获得,无需医疗人员,可实现居家检测;患者不会产生不适感;获取量不受限制,因此尿液成为膀胱癌液体活检的好材料。
膀胱癌诊断的金标准是膀胱镜检查,另外还有传统的细胞遗传学技术如尿脱落细胞学检查和UroVysion荧光原位杂交(FISH),但其灵敏度和特异性等性能指标难以满足临床诊断的需要,尤其对低级别膀胱癌检测灵敏度较差,更无法实现膀胱癌的早期筛查。基于此,仁东医学自主开发了一种简单、经济、可靠的膀胱癌尿液sWGS(shallowwholegenomesequencing,低深度全基因组测序)检测技术,该技术可以对膀胱癌待检者尿液中的cfDNA进行低深度全基因组测序以评估膀胱健康状态,转化产品将用于泌尿系统肿瘤的早筛和监测。
What?
什么是低深度全基因组测序
基因组领域中的研究者通常都趋向于获得更多的测序数据,比如全基因组测序平均测序深度一般为30X;全外显子组测序平均测序深度一般为-X;而为了检测低频突变使用超高深度测序技术的测序深度从几千到几万乘不等。不同的是,低深度全基因组测序(sWGS也称为shallowWholeGenomeSequencing或low-coverageWholeGenomeSequencing)只需要0.1-3X的测序深度,低深度全基因组测序技术最初在产前诊断中应用,它可以灵敏检出胎儿的染色体异常。sWGS可以在极低深度的情况下仍然准确检测拷贝数变异(CopyNumberVariation,CNV),其优势在于样本量低、周期短、成本低、精度高,是一种相对更便宜的高通量测序技术。
图1.sWGS测序分析流程图
Why?
为什么使用低深度全基因组测序
肿瘤早筛是肿瘤研究领域的热点,如果采用常规的影像学、单核苷酸突变等检测技术常常力有不逮,这是因为在癌变发生的早期肿瘤细胞的数目极低。随着肿瘤细胞的凋亡,少量的ctDNA会被释放到患者外周血或体液中。所以通过对外周血或者体液中的cfDNA进行全基因组的扫描来检测染色体结构异常在技术路径上具备可行性。sWGS可用于临床相关的结构变异,例如致癌扩增、抑癌基因缺失和染色体不稳定性。
目前国内外已有许多研究团队进行基于sWGS的肿瘤检测算法和肿瘤分子标记物的开发:
sWGS的应用案例1
图2.多组学维度HCCseek模型原理示意图
医院团队对入组的76例初诊的肝细胞癌(hepatocellularcarcinoma,HCC)患者和例健康受试者进行了一项名为HCCseek的检测。采用cfDNAsWGS检测技术,选取了两个癌症特异性地貌特征-基因拷贝数畸变和片段大小,同时,结合肝癌特异性肿瘤标志物AFP,通过机器学习构建多组学多维度算法模型HCCseek,用于计算受检者罹患肝癌概率值PHCC。检测灵敏度为75.0%,特异度为98.0%,准确度为92.6%,AUC为0.,在I期HCC的灵敏度为58.6%[1]。
sWGS的应用案例2
图3.研究概况图
美国国家癌症研究所和华盛顿大学医学院的联合研究团队对23名PN(良性丛状神经纤维瘤)患者、14名尚未接受治疗的MPNST(恶性周围神经鞘瘤)患者和16名健康个体采集的血液样本,利用cfDNA片段组学和超低深度全基因组测序(ultra-low-passwholegenomesequencing,ULP-WGS)技术将MPNST与良性PN前体区分开来,预处理准确率达86%。同时,研究结果显示,利用ULP-WGS进行cfDNA片段分析有潜力成为监测治疗反应的生物标志物检测方法,并作为MPNST早期检测的筛选分析[2]。
sWGS的应用案例3
图4.研究设计流程图
北京基因组研究医院研究团队通过对95名无癌个体和65名尿路上皮癌(UC)患者、58名肾癌患者和45名前列腺癌患者的尿液cfDNA进行sWGS,评估了拷贝数改变(copynumberaberrations,CNA)。研究者使用支持向量机开发了基于CNA特征的诊断分类器来检测UC(UCdetector)。该模型在一个独立队列(52名患者)中得到进一步验证。来自90例上尿路上皮癌(UTUC)肿瘤标本的基因组测序数据和来自癌症基因组图谱的例膀胱尿路上皮癌(UCBs)的CNA数据用于验证分类器。研究者将32例UC患者尿沉渣基因组测序数据与cfDNA进行比较,为了监测治疗效果,研究者还收集了7名治疗后患者的cfDNA。尿液cfDNA是比尿沉渣更敏感的替代品。UCdetector检测UC的中位临床敏感性为86.5%,特异性为94.7%,同时,UCdetector在独立验证数据集中表现良好。值得注意的是,UCdetector选择的CNA特征是UTUC和UCB的特异性标记。此外,cfDNA中CNA的变化与治疗效果一致。同时,在70.1%的患者中,同样的策略可以将泌尿生殖系统癌症定位到起源组织[3]。
How?
仁东医学怎么做膀胱癌尿液sWGS
图5.仁东医学膀胱癌尿液sWGS测序分析流程图
国内外研究者推出了许多基于sWGS检测CNV的软件,主流的分析策略是read-depth(RD)。RD的原理基于read覆盖深度和拷贝数的相关性,即缺失区域测序深度相对低,插入区域测序深度相对高。采用滑窗的方式进行测序深度分布统计,测序对高GC含量区域具有偏好,统计时对每个窗口内的测序深度进行校正,利用校正之后的RD值,对邻近的bin进行聚类,获得CNV拷贝数。
低深度全基因组测序(sWGS)得到的覆盖深度呈现出来的是一个泊松分布——因为基因组上任意一个位点被测到的几率都是很低的,与baseline(背景库)进行比较得出gain或者lost的结论。
软件检测CNV主要包括三步:1.数据标准化,2.分段(segmentation),3.bin聚类。
数据标准化:建立健康人群的尿液cfDNA深度基线;根据参考基因组的已知特征(重复序列、GC含量、可映射性和多态性等)校正。
分段:对于RD的软件算法,binsize的设定十分关键。由于cfDNA的断裂方式,释放到体液或血液中的cfDNA并不是均匀覆盖基因组。我们发现对于低深度全基因组测序数据,binsize越大噪音越少,但是对短片段CNV不敏感。
bin聚类:使用HMM等算法对邻近的bin进行聚类,聚为一类的bin具有相同的CNV拷贝数。
尿液“CNV-burden算法模型”的开发
仁东医学自成立以来,坚持扎根泌尿垂直瘤种,凭借多年来在生命组学与大数据信息技术领域的深厚技术与资源积累,在膀胱癌早筛早诊技术领域中开展了基因检测产品的研发。面对早期无症状膀胱癌患者的尿液中的ctDNA浓度低、易降解、早期诊断产品灵敏度不高等多项挑战时,仁东医学湿实验研发团队迎难而上,对提取建库技术不断优化,终于实现了测序DNAinput量低至1ng,测序深度低至0.1X均可以稳定检出的可喜成果。
与此同时,仁东医学算法开发团队提出了一种基于尿液cfDNA低深度全基因组测序预测膀胱癌的机器学习模型。该模型在一组独立数据验证中,其灵敏度、特异性和AUC均取得了不错的结果,对及时、准确地诊断早期无症状膀胱癌具有重要科学意义和临床价值,该模型还能够准确提示膀胱癌患者术后的进展情况。待检者只需寄送一份50ml的晨间尿液样本至仁东医学实验室,5个工作日即可获得检测结果。总之,该技术所体现无创、便捷的特点,可作为膀胱癌的早期检测筛查工具,未来我们也将通过进一步实验证实其诊断效果,加快进入临床成果转化,为更多患者带来福音。
下期预告
Nextissue
年2月23日(下周三)早上8点钟,“仁东医学六周年全新企划”第十三期,也是我们《报告解读系列:怎样看懂一份基因检测报告》的第三课,由仁东医学遗传咨询部来和大家谈谈《怎么看懂一份基因检测报告:遗传性变异解读规则》。敬请