响马读paper

一个要求成员每月至少读一篇文献并打卡的学术交流社群

本页面显示由用户 半面阳光 推荐的文献。 当前共有 22 篇文献,本页显示第 21 - 22 篇。

21.
2022, Genetics in Medicine. DOI: 10.1016/j.gim.2022.04.021
2022-08-31 21:17:00
#paper https://doi.org/10.1016/j.gim.2022.04.021. Recommendations for next generation sequencing data reanalysis of unsolved cases with suspected Mendelian disorders: A systematic review and meta-analysis. 这篇文章发表在2022年8月的Genetics in Medicine上,是一篇系统综述。基于NGS的临床全外显子组(WES)和临床全基因组(WGS)测序给孟德尔遗传病的诊断带来了很多进展,但是有超过50%的病例无法从测序结果中得到明确的致病原因。周期性地对这些没有明确结论的测序数据进行重新分析有助于进一步确定致病变异。那么重新分析的患者获益有多少、临床应用的可行性有多大,还有在初次测序后多长时间进行重新分析,以及选择什么方法和工具进行分析都是尚待探究讨论的问题。这篇文章意图分析和解答这些问题。作者采用了meta分析的方法首先对2007年到2021年发表的相关文献进行了检索和初步筛选。接着针对文章的主题,设计了一个文献筛选标准,最终筛选得到29篇研究性文献,包含了9419个未确诊的孟德尔遗传病患者。研究发现,重新分析的整体诊断产出为0.10(95% CI = 0.06-0.13)。大部分诊断结果的更新取决于遗传变异的新文献报道。重新分析得到确诊结果在初次检测的24个月后比较多,但是这个数据并没有统计意义。基于AI的一些新分析工具对于提高重新分析的诊断率并没有显著的价值。此外,对测序数据进行重新分析的研究文章有很大的差异性,这也使得本文的一些关键问题无法得出有意义的结论,作者最后也提出希望可以有标准化指南来指导后续的重新分析研究。除了研究结果和结论本身,这篇文章另一个值得借鉴的内容是其研究方法。在研究方法部分作者参考了很多筛选文献、评估研究数据的标准化方法和指南,这对于我们平时管理文献和数据、从文献中提取关键信息、对变异进行biocuration都很有帮助。作为ACMG的官方期刊,Genetics in Medicine最近发表了不少这方面的综述性文章,以及AI与临床NGS数据分析结合的文章。
22.
2021, Proceedings of the National Academy of Sciences. DOI: 10.1073/pnas.2019768118
2022-07-26 14:25:00
#paper DOI: 10.1073/pnas.2019768118, 2021 Feb 2;118(5):e2019768118. Genome-wide detection of cytosine methylation by single molecule real-time sequencing. 这篇文章并非一篇最新发表的文献,是香港中文大学卢煜明团队于2021年发表在PANS上一篇研究文献。因为近期在一个学术会议上听到卢煜明教授介绍了这篇文献有关的研究结果,因此拿来研读。这篇文章的核心内容是利用PacBio的SMRT三代测序技术和卷积神经网络来检测DNA的甲基化。胞嘧啶的甲基化修饰,5-Methylcytosine (5mC) 是表观修饰中最重要的一种类型。应用比较广泛的检测CpG测序方法是亚硫酸盐测序(BS-seq)。但是BS-seq有一些不足之处,比如亚硫酸盐会导致DNA降解、还会将DNA序列中非甲基化的胞嘧啶(C)转化为胸腺嘧啶(T),影响后续的比对;而原始序列中C->T的点突变则又无法被亚硫酸盐所修饰。因此,在这篇文献中,作者采用单分子实时测序(Single molecular rea-time sequencing, SMRT sequencing)技术,开发了一个直接检测5mC的方法。这个方法将SMRT测序中的两个关键信息作为输入数据,结合卷积神经网络(CNN)构建了一个称为Holistic Kinetic (HK)Model 的检测方法。关键输入数据包括两个:一是SMRT测序中DNA聚合酶的动态信号(包括单个碱基发出荧光信号的时间和两个连续碱基之间的间隔时间),二是“序列背景”信息,即待检测的一段固定长度的DNA序列信息,这段固定长度的序列被称为一个“检测窗口”。作者首先用全基因组扩增的方法构建了一个非甲基化的数据集(阴性数据集,所有序列几乎都没有甲基化),同时用M.SssI 转甲基酶处理DNA样本构建了一个甲基化(阳性数据集, M.SssI 能够对双链DNA上的所有CpG位点进行甲基化);接着从这两个数据集中各取出一半数据来训练卷积神经网络,剩下的数据用于验证HK model的检测效果。结果显示,用HK model来区分甲基化状态的AUC最高达到了0.97。全基因组范围内在单碱基分辨率水平上检测5mC的敏感性和特异性分别达到90%和94%。研究结果还发现通过调节检测窗口大小和测序深度能够改变HK模型的检测效果。为了平衡下游数据分析与准确性之间的关系,最后选定21nt作为检测窗口的默认值,将10×作为测序深度的默认值。后续,作者采用一段人和小鼠杂交序列验证了HK模型在检测“杂合甲基化”序列(即同一段序列中同时包括甲基化和非甲基化的CpG )的可行性。此外,作者还对BS-seq的检测效果和HK model的检测效果进行了简单的比较研究。看这篇文献的感受一方面是工作量大,二是体现了作者对分子生物学的理论知识和测序技术特点的充分理解和应用。另外,这篇文献的整体研究框架和卢煜明团队以往的研究在思维上有着一脉相承的感觉,都体现了透彻地理解基本理论、灵活地运用测序技术来解决临床检测的难题。
TOP