响马读paper

一个要求成员每月至少读一篇文献并打卡的学术交流社群

当前共有 940 篇文献,本页显示第 781 - 800 篇。

781.
2022, The Journal of Molecular Diagnostics. DOI: 10.1016/j.jmoldx.2022.05.003
2022-06-21 00:03:00
#paper doi:10.1016/j.jmoldx.2022.05.003 The Journal of Molecular Diagnostics, 2022, Comprehensive Validation of Diagnostic Next-Generation Sequencing Panels for Acute Myeloid Leukemia (AML) Patients. 这是来自瑞士和德国的一篇关于血液肿瘤基因检测panel验证的文章。通常认为,肿瘤是遗传病,即由于遗传物质发生突变而导致的疾病。因此,在诊断和治疗决策过程中,会需要开展特定基因的检测。在临床实践上,可以采取panel富集特定DNA片段进行测序的方法,这也是目前肿瘤相关基因检测商业服务的基本模式。这种检测服务得以上市的前提,是需要经过充分的验证。本文便是这样一个验证过程的实例。本文的验证对象,是为诊断AML(急性髓系白血病)的panel,验证过程纳入了26例AML患者的33个DNA样本(骨髓或外周血),以及Acrometrix Oncology Hotspot Control DNA作为对照。对这些样本中携带的AML相关突变进行了检测和性能评价。而临床样本中的突变,也采用qPCR、Sanger测序等方法进行了确认。通过评估,从四个不同panel及多种分析软件中,选出了针对血液病性能最佳的panel及软件组合。
782.
2018, Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. DOI: 10.1145/3219819.3219822
2022-06-20 08:27:00
#paper doi:10.1145/3219819.3219822,Deep Distributed Fusion Network for Air Quality Prediction .2018年的kdd论文,从现在的角度看,或者从当时的角度看,作者所构建的这个网络都并不复杂。这个网络主要包括2个组件:空间变换组件以及深度分布融合组件。 1.设计了一个空间变换组件,将空间稀疏的空气质量数据转换为模拟二手污染物源的一致输入, 借助来自空间邻居的信号(根据分布方位分为远近及东西南北向供16个),DeepAir 在一般情况和突变情况下具有更好的性能。 2.考虑到直接和间接因素对空气质量的影响不同,分别使用每个间接因素与直接因素进行一个子网络构建,以及构建一个整体子网络,最后进行融合。。  3.这个论文的网络结构虽然不复杂,但是却很贴近业务。是基于业务的基础上对网络进行设计的。作者基于 9 个中国城市的三年数据,结果表明 DeepAir 与 10 个基线相比具有优势。 在短期、长期和突变预测方面的相对准确度分别提高了 2.4%、12.2%、63.2%。
783.
2022, Genomics, Proteomics & Bioinformatics. DOI: 10.1016/j.gpb.2022.03.002
2022-06-20 07:48:00
#paper doi:10.1016/j.gpb.2022.03.002 Genomics, Proteomics & Bioinformatics, 2022, Cancer is a survival process under persistent microenvironmental and cellular stresses. 这篇综述是关于癌症发生发展的机制,提出了一个新的框架看法。相较于传统以突变为核心的理解,该新看法的关键点在于,认为癌细胞的持续分裂是其生存的“必须”行为,而非仅受遗传物质突变所指导的被动结果。针对这个看法,文章从代谢模式变化、胞质pH状态、慢性炎症、过量铁积累负荷、芬顿反应等角度分别进行了阐释。对于某些癌种随年龄增长其发病率反而下降,以及某些物种很少发生或几乎不会发生癌症,这种看法也提供了新的解释。
784.
2022, Genome Medicine. DOI: 10.1186/s13073-022-01069-z
2022-06-19 00:14:00
#paper doi:10.1186/s13073-022-01069-z Genome Medicine, 2022, Reanalysis of exome negative patients with rare disease: a pragmatic workflow for diagnostic applications. 过去这些年里,我们经常会对罕见遗传病患者开展全外显子组测序,以便确认其致病基因并形成诊断结论。然而,受限于技术和积累的知识,大部分患者在测序后也仍然无法确诊。这篇来自荷兰拉德堡德大学(Radboud University)的文章,回顾了其医学中心在2011年11月至2015年1月期间到访的疑似罹患复杂神经系统遗传疾病的150名儿童患者,对其中103名未得到确诊的患者进行了随访调查,通过重新查阅评估表型信息、重新分析其全外显子测序数据,以及对仍无法确诊的患者(使用新的实验流程和外显子panel)重新进行测序和分析。这一系列操作,让32名之前未被诊断的患者得到确诊,诊断率从31%(47/150)提升到53%(79/150)。其结果也支持了在临床护理和后续随访过程中,应该对未确诊患者进行重新分析和系统评估,新的临床证据信息、新的技术方法和分析方法,都有助于改善诊治,使患者获益。
785.
2022, ACS Synthetic Biology. DOI: 10.1021/acssynbio.2c00120
2022-06-18 14:39:00
#paper doi:10.1021/acssynbio.2c00120 ACS Synthetic Biology, 2022, Graph Computation Using Algorithmic Self-Assembly of DNA Molecules. 利用DNA等生物分子进行计算,可以追溯至上世纪90年代初,该领域这些年来不断进步并取得新成果,本文便是这样的一个案例。本文另辟蹊径,使用了一种称为DNA折纸的技术(即通过精巧地设计DNA序列,使其折叠成为某种特定形状),来解决一个“六顶点三色涂色”的图论计算问题。宏观上极少量的生物物质,其实包含着数量庞大的分子,因而,使用这些分子进行计算,是一个天然能提供巨大算力的策略,可以很轻松实现大量排列组合的暴力穷举,这就是生物计算概念提出的基本出发点之一。虽说被称为“DNA computing”,但它其实还远不及我们日常认识的通用电子计算机。本文的研究,是在特定图论问题上,人为列举出各个待求顶点的所有可能颜色,以及利用DNA链互补特性,设计相应序列,实现控制哪些顶点之间可以互相连接的规则。然后大量合成这样的分子,使其在特定实验条件下自由组合,最终利用AFM(原子力显微镜)扫描,找到符合特定结构形状的答案。由于使用了DNA折纸技术,AFM可以直接观察并识别出各顶点的“颜色”及连接组合,从而给出问题的求解。文章所解决的问题,被限定在特定范围,且只是概念验证阶段,未来要扩展到更多应用场景,使其具备“通用”或一定程度“通用”的程度,还有很长的路要走。
786.
2022, bioRxiv. DOI: 10.1101/2022.06.12.495839
2022-06-17 22:10:00
#paper doi:10.1101/2022.06.12.495839 bioRxiv, 2022, Accurate Estimation of Molecular Counts from Amplicon Sequence Data with Unique Molecular Identifiers. 高通量测序数据中充满由PCR扩增和测序过程导致的错误,为解决此问题,人们通常会引入分子标签(UMI)技术,即用一段随机序列来标记出哪些序列来自同一原始模板分子,而哪些不是。很多工具在处理UMI时,都简单粗暴地将相同UMI的序列直接进行合并,而由于UMI序列本身也存在突变,会导致还原样本中原始模板分子信息的过程被误判。这个过程在扩增子测序(amplicon-seq)中尤为明显。本文通过构建一个单步隐马科夫模型(one step HMM),来处理PCR和测序过程中的错误,并用C语言实现了一套EM算法,对UMI测序数据的真实原始模板分子数进行估算。在模拟数据和真实数据中,分别进行了评测,对比既往其他类似工具,本文开发的工具(DAUMI),能有效识别出UMI冲突(UMI collision),表现出更优异的性能。
787.
2022, Nature Genetics. DOI: 10.1038/s41588-022-01075-2
2022-06-16 00:40:00
#paper doi:10.1038/s41588-022-01075-2 Nature Genetics, 2022, Allelic imbalance of chromatin accessibility in cancer identifies candidate causal risk variants and their mechanisms. 这又是一篇只有两位作者署名的论文。如今,司空见惯了一篇文章动辄好几十位甚至成百上千位作者的情况,见到这类一两位作者“单打独斗”的作品,还是挺佩服的。从这篇文章,我学到个新词“调节组(regulome)”;相应地,其关联分析方法,被称为“regulome-wide associations study (RWAS)”。这篇文章还有个特点,它并未通过湿实验产出新数据,而是完全使用公开数据进行分析,包括结果验证,也是在公共数据库中进行。从概念到方法上进行创新,而成果发表到Nature子刊上,挺值得学习的。作者使用了来自TCGA的406例ATAC-seq数据,涵盖23个不同癌种,识别出7262个胚系allele-specific accessibility QTLs (as-aQTLs),即把染色质开放程度当做一种数量性状来研究,这个aQTL也是仿照eQTL提出的概念,的确很有意思。而通过RWAS,在各个癌种中鉴别出与癌症发生风险相关的as-aQTL位点,且发现它们在癌症风险遗传力方面的富集度甚至优于其他功能注释。这不仅实现了对非编码的“垃圾DNA(junk DNA)”区间的功能研究和解释,也开辟了肿瘤治疗的新思路,即针对这些调控区间及其相关机制来开展治疗。
788.
2022, NeuroImage. DOI: 10.1016/j.neuroimage.2022.119297 PMID: 35568346
2022-06-15 21:04:00
#paper https://doi.org/10.1016/j.neuroimage.2022.119297. A deep learning-based multisite neuroimage harmonization framework established with a traveling-subject dataset. 分享一篇师弟与我合作发表的工作。多中心效应在不同的研究领域都是一件非常难解决的问题,比如在脑磁共振成像研究中观察到的显著效应及其得出的结构功能特征在不同中心的数据上会得出不一致的结果。这篇文章提出了一个深度学习框架,利用特征解耦的建模方式分离与脑结构无关的站点特征和仅与脑结构有关的生物特征。这个方法可以显著消除灰质图的中心差异,并且编码器部分有效的编码了与站点效应有关的抽象特征以及与大脑结构有关的特征。
789.
2022, BMC Bioinformatics. DOI: 10.1186/s12859-022-04783-y
2022-06-15 06:27:00
#paper doi:10.1186/s12859-022-04783-y BMC Bioinformatics, 2022, CancerNet: a unified deep learning network for pan-cancer diagnostics. 这篇文章建立了一个通用的深度神经网络模型,基于来自TCGA的33种癌症的甲基化数据,检测癌症及其起源组织。同样的任务在2022年已有相应工作,能够达到96%的总体准确率。本文则通过同时使用无监督与有监督的方法,让模型在输出34个分类结果(33个癌种+1个正常非癌)的同时,也额外生成一组重新构造的CpG岛甲基化信息,并将生成的此信息,与用于模型输入的CpG到甲基化信息进行比对,损失函数中同时纳入了该比对差异。通过这种方式,模型整体性能得到进一步提高,总体准确率达到99.6%。此外,本文也同时考察了年龄、转移等混杂因素对模型的影响,并为未来研究和开发模型的可解释性提供了基础。整个研究基于OSF(开放科学框架)进行,数据和源代码都完全开放,是一份不错的学习材料。
790.
2022, Human Mutation. DOI: 10.1002/humu.24378
2022-06-14 00:32:00
#paper doi:10.1002/humu.24378 Human Mutation, 2022, Short amplicon reverse transcription-polymerase chain reaction detects aberrant splicing in genes with low expression in blood missed by ribonucleic acid sequencing analysis for clinical diagnosis. 这篇文章的标题很守规矩,把一大堆缩写都展开写全了,害我仔细辨认了半天:“reverse transcription-polymerase chain reaction” 其实是 rt-PCR,“ribonucleic acid sequencing” 其实是 RNA-seq。原来这是个说明“在某些情况下,rt-PCR相比RNA-seq更好”的故事。文章从另一个研究(Splicing and Disease Research Study)中选出了13个实际临床病例,它们在一些血液中通常低表达的基因上,已知存在诸如“外显子跳跃”这样的剪切相关突变,将这些病例的外周血样本,提取RNA后,分别进行RNA-seq和rt-PCR,确认了短片段rt-PCR的确能够有效且更灵敏地检出这些突变,而在RNA-seq中因为表达量太低而难以检出。从而验证了短片段rt-PCR方法可用于此类低表达基因的剪切相关突变的检测。
791.
2022, Nature Genetics. DOI: 10.1038/s41588-022-01082-3
2022-06-13 05:47:00
#paper doi:10.1038/s41588-022-01082-3 Nature Genetics, 2022, Genomic analysis defines clonal relationships of ductal carcinoma in situ and recurrent invasive breast cancer. 本文研究导管原位癌(DCIS)。该疾病常见于乳腺癌筛查,即使经过治疗,也仍然有小部分患者会恶化复发成为浸润性乳腺癌。本文试图研究,恶化的这些患者,是否都来自原发性DCIS的复发克隆,亦或仅是新发的无关疾病。为此,本研究纳入了129对DCIS复发病例样本(即原位DCIS样本和复发样本;同时也包含匹配的癌旁对照组织),通过开展全外显子组测序、SNP芯片检测或靶向基因组panel测序(这里技术平台方法存在差别,是因为样本及其实验,分别来自和开展于荷兰、英国和美国的三家不同单位),进行基因组突变分析和拷贝数变异分析。同时也从中选取了4例病例,将其原发与复发组织,分别进行解离并开展单细胞基因组测序。针对这两种策略,都分别进行了克隆演化分析,最终确认并非所有同侧浸润性乳腺癌都与先前的 DCIS 有克隆相关性,其中有约五分之一其实为新发原发性癌症。此结果也在更大范围且更详细的程度上,验证了前人的研究结果。
792.
2022, Journal of Mathematical Psychology. DOI: 10.1016/j.jmp.2021.102632
2022-06-12 23:52:00
#paper DOI: https://doi.org/10.1016/j.jmp.2021.102632 A step-by-step tutorial on active inference and its application to empirical data 零基础入门自由能理论框架及代码编程细节,本论文从自由能基础开始介绍,以构建马尔科夫模型为中心,以落地掌握应用为目标,使用matlab代码,也介绍有开源python代码,有基础讲解也有高阶功能介绍,有层级模型的解读,内容还是比较多,深入下去看需要很大功夫。关键点推荐参考:https://mp.weixin.qq.com/s/FlqNQzCphhefOlgDD6vL9g
793.
2022, Scientific Reports. DOI: 10.1038/s41598-022-13336-5
2022-06-12 07:49:00
#paper doi:10.1038/s41598-022-13336-5 Scientific Reports, 2022, Omics-based integrated analysis identified IKZF2 as a biomarker associated with lupus nephritis. 相信很多人知道系统性红斑狼疮(SLE)这个疾病,跟我一样都来自二十多年前的一部火遍大江南北的虐心小说《第一次亲密接触》。而这篇文章所研究的,正是SLE的重要并发症和主要致死因素狼疮性肾炎(LN)。本文收集并挖掘了肾脏组织的公共数据,包括LN患者的肾小管间质和肾小体组织,也包括肾移植捐献者的健康肾组织,由这些数据找到26个常见差异表达基因(co-DEGs)。在此基础上,将其中的 IKZF2 基因作为重点,通过功能富集、蛋白-蛋白相互作用网络、ceRNA网络构建、免疫浸润、风险评估等常用生信方法进行分析,从而确定了 IKZF2 基因在 LN 疾病方面的预测和评估价值。文章的方法本身没有多少亮点,属于常见的套路玩法,应该是所选择的临床问题,为其提供了一定创新性和研究价值。
794.
2021, Review of Philosophy and Psychology. DOI: 10.1007/s13164-021-00579-w
2022-06-11 20:31:00
#paper DOI https://doi.org/10.1007/s13164-021-00579-w Active Inference as a Computational Framework for Consciousness 意识作为一个复杂的现象,对它的研究应该梳理好研究方法,研究思路,研究框架,研究;自由能作为一个统一的框架,包括主动推理,预测过程等,对意识研究提供了整合的帮助,包括因果反事实,层次框架等,这篇论文对此进行了相关阐述,罗列了相关实验,可以参考:https://mp.weixin.qq.com/s/q7dsFAXTz00-rfdz6Qlw8A
795.
2022, Cell. DOI: 10.1016/j.cell.2022.04.016
2022-06-11 14:48:00
#paper doi:10.1016/j.cell.2022.04.016 Cell, 2022, Structural basis for RNA surveillance by the human nuclear exosome targeting (NEXT) complex. 这篇发表在最新一期《Cell》杂志上的文章,来自MSKCC(纪念斯隆·凯特琳癌症中心),仅有两位署名作者,M. Rhyan Puno 和 Christopher D. Lima。这项研究主要是基于冷冻电镜(cryo-EM),研究人细胞核外切体靶向(NEXT)复合物的分子结构。标题中的exosome是包含多种核酸外切酶的蛋白复合体,在细胞中起到外切和降解RNA的作用,是关乎RNA分子生存期及细胞内稳态的重要机制。另一个在液体活检领域常见的概念“外泌体”英文单词也是exosome,但其为包裹和使细胞向外分泌蛋白与核酸等分子的具有磷酸双分子层膜的囊泡结构,与此篇文章的exosome无关,应避免混淆。冷冻电镜是一种可以使生物大分子尽量维持在生物体内活性状态下,并被测定其原子级别高分辨率结构的技术。本文基于它,详细分析了组成 NEXT 复合物的核心蛋白 MTR4、RBM7 和 ZCCHC8 的结构及组装关系,包括它们所形成的复合物,结合底物 RNA 的通道。并结合其他分子实验,包括突变体细胞系构建、免疫沉淀、RNA表达谱测序等,分析和确认了它们在识别底物 RNA 过程中的作用。对 ZCCHC8-ROS1 融合等突变形式,对相应酶活性的影响,以及所导致的表型或疾病发生,也做了相应的研究和讨论。本文应该算是一篇典型的结构生物学研究文章,所研究的内容,属于普遍存在于所有真核生物与古菌生物的基础生物学问题,具有教科书级的重要意义。
796.
2020, Cancer Medicine. DOI: 10.1002/cam4.2816 PMID: 32142223 PMCID: PMC7196062
2022-06-10 12:26:00
#paper Ropio J, Chebly A, Ferrer J, Prochazkova-Carlotti M, Idrissi Y, Azzi-Martin L, Cappellen D, Pham-Ledard A, Soares P, Merlio JP, Chevret E. Reliable blood cancer cells' telomere length evaluation by qPCR. Cancer Med. 2020 May;9(9):3153-3162. doi: 10.1002/cam4.2816. Epub 2020 Mar 6. PMID: 32142223; PMCID: PMC7196062.题目:Reliable blood cancer cells' telomere length evaluation by qPCR 端粒缩短与一系列不同的人类疾病有关,因此需要可靠的测量方法来揭示这种关联。在众多端粒长度测量方法中,qPCR被认为是一种易于进行且经济高效的方法,可以研究DNA含量较低的样本。文章采用采用相对和绝对qPCR方法检测癌细胞端粒长度。qPCR数据与terminal restriction fragment (TRF),(端粒长度测量“金标准”)测量值进行比较。从每个样品(细胞系、患者和健康供体)的重复反应中收集数据。当重复中 Ct 的标准偏差低于 0.5 时,接受重复值。qPCR 估计的平均细胞系端粒长度(4.320 ± 0.143 kb)与 TRF 估计的(5.652 kb).相似,P = 0.5040。对基于 qPCR 的技术,测量端粒长度要求使用高质量的 DNA,当DNA降解严重时,QPCR的测量不准确。如果QPCR法测量端粒长度的细胞是癌细胞,那关键点在于选择合适的参考基因,因为癌细胞的增殖不像正常细胞那样规范,癌细胞增殖时有些基因会丢失,癌细胞还会积累遗传和染色体异常。
797.
2006, BMC Molecular Biology. DOI: 10.1186/1471-2199-7-3 PMID: 16448564 PMCID: PMC1413964
2022-06-10 07:29:00
#paper doi:10.1186/1471-2199-7-3 BMC Molecular Biology, 2006, The RIN: an RNA integrity number for assigning integrity values to RNA measurements. 在分子生物学实验中,涉及到RNA质控,评估其分子完整性,最重要且最广泛使用的指标,当属RIN值(RNA integrity Number)。16年前的这篇文章,正是关于RIN值算法及建立过程的工作。Agilent、Roche 和 Quantiom bioinformatics 等单位参与了此项工作。该算法成为至今仍在使用的 2100 生物分析仪的标配和重要输出指标。在RIN值之前,通常使用 28S和18S rRNA的比值来进行评估(一般要求达到至少2.0),而这个比值受电泳胶图展示和手工测量的影响,经常不够稳定,在实验室之间存在很大差异,更重要的,其与RNA分子的完整性经常并不相关。于是,本文开发了一套方法,使用毛细管电泳技术,采集到样本中的所有不同长度核酸分子的丰度信息,由此自动提取特征,基于贝叶斯方法和神经网络算法,构建回归模型,并最终选择出估计RNA完整性的特征组合,并计算出RIN值(取值1-10,1代表完全降解,10代表无降解)。研究者从人、大鼠、小鼠的不同器官组织,以及各类细胞系中,分别提取了RNA,共收集了1208份样本,这其中主要是未降解的完整样本和完全降解的样本,此外也包括了足够的部分降解的样本。通过不同比例的组合将其混合,构造了一套包含各种不同降解程度的实际样本,用于产出数据、提取特征后构造分类模型,以及对该分类模型(模型输出为RIN值,分别为1-10的整数)的性能评估。同时也将模型算法计算得到的rRNA比值、RIN值,与(4个看家基因的)rtPCR数据进行了对比,确认其对RNA质量和完整程度的代表性。
798.
2022, Nature. DOI: 10.1038/s41586-022-04803-0
2022-06-09 07:56:00
#paper doi:10.1038/s41586-022-04803-0 Nature, 2022, Cohesin-mediated loop anchors confine the locations of human replication origins. 这篇新发表在Nature上的文章,来自一项大型研究项目,The 4D nucleome project (doi:10.1038/nature23884),该项目旨在开发并应用一系列生物技术方法,研究人类和小鼠基因组在时空上的结构特性,以深入了解细胞核的组织和功能,4D指的正是三维空间结构加上时间动态变化。在这篇文章中,作者们主要对该项目 Phase 1 的 Tier 1 H1 Human hES (hES) 细胞系的 Hi-C 数据进行分析,通过其自研方法,鉴定出全基因组水平上高分辨率的 TADs/subTADs(拓扑关联域/拓扑关联子域),并分析它们与染色质loop、DNA复制起始区(IZ)之间的分布关系,结合这些数据的采集方法及细胞所处周期等信息,提出由cohesin介导的loop挤压和复制推动的相关模型。同时,使用靶向 CRISPR–Cas9 基因组编辑方法,干扰CTCF+cohesin后对复制的影响,也验证了该模型。这项工作展示了如何通过组学数据分析,提出在分子细胞生物学相应概念模型的研究方法,很值得学习。
799.
2020, OSF Preprints. DOI: 10.31219/osf.io/68nhy
2022-06-08 21:18:00
#paper DOI https://doi.org/10.31219/osf.io/68nhy 意识很难定义,那如何研究意识,通过范畴论中的yoneda lemma,我们可以通过研究一个对象的关系来研究这个对象,这个方法对研究意识非常有帮助。这一创新的数学范畴应用到意识的研究思路希望可以推进意识的研究。
800.
2022, Review of Philosophy and Psychology. DOI: 10.1007/s13164-021-00604-y
2022-06-08 12:38:00
#paper DOI https://doi.org/10.1007/s13164-021-00604-y 意识科学之前大多通过人类自我的反思来思考,后面随着工具的发展,脑科学工具的发展,从神经扫描,脑电波等等途径继续分析,这些仍然是从现象入手,随着主动推理,自由能框架的发展,自由能对非稳态复杂系统,生命的建模,这个框架自然建模了智能及意识等,这篇就是从自由能入手分析意识的计算方法分析。详情参考:https://mp.weixin.qq.com/s/nltUaly_iaGD6poIAHGn4A
TOP