响马读paper

一个要求成员每月至少读一篇文献并打卡的学术交流社群

本页面显示发表在 Nature Genetics 杂志的文献。 当前共有 15 篇文献。

1.
2024, Nature Genetics. DOI: 10.1038/s41588-024-01715-9
2024-04-30 22:30:00
#paper doi:https://doi.org/10.1038/s41588-024-01715-9,Nature genetics, 11 April 2024. A pan-genome of 69 Arabidopsis thaliana accessions reveals a conserved genome structure throughout the global species range. 通过对来自全球不同地理起源的 72 个拟南芥种质进行SNP分析,确定了四个主要遗传群体:“欧洲”、“非洲”、“马德拉”和“亚洲”,以及三个“混合”种质。使用了长读取(PacBio HiFi,平均深度为 45×,和牛津纳米孔,平均深度为 67×)和短读取测序,结合参考导向的拼接和手动修正,为每个 72 个种质生成了基因组组装。69 个种质经确认为纯合子品系,为了解释基因组大小变异的潜在基因组特征,选择了最完整的 46 个组装,并分析了组装与基因组大小估计的比值以及着丝粒重复长度与着丝粒大小估计的比值。这些种质的组装大小范围从 130 到 148 Mb。着丝粒重复序列平均长度为 14 Mb,与组装大小高度相关。通过从个体组装的初始 TE 注释生成的 pan-TE 库注释了转座元件。TE 空间大小在基因组之间非常相似,长末端重复序列和 Helitrons 占据了最大的 TE 分数。拟南芥基因组大小变异主要由着丝粒重复长度主导,而 TE 只是次要贡献者。单个染色体的大小独立于彼此地演化。后续作者利用共线性分析,发现拟南芥的染色体臂存在高度的同源性,而在着丝粒附近存在大型的重排现象。后续对泛基因组进行基因家族分析,发现一些核心、软核心、可选和私有家族基因。
2.
2024, Nature Genetics. DOI: 10.1038/s41588-024-01686-x
2024-03-31 17:31:00
#paper Fehlings, D.L., Zarrei, M., Engchuan, W. et al. Comprehensive whole-genome sequence analyses provide insights into the genomic architecture of cerebral palsy. Nat Genet (2024). https://doi-org-443.webvpn.las.ac.cn/10.1038/s41588-024-01686-x 本文对超过320名患有脑瘩(CP)的儿童及其生物学父母进行了全基因组测序(WGS)数据分享。研究发现,11.3%的儿童存在致病/可能致病(P/LP)变异,17.7%的儿童存在不确定意义的变异。这些变异类型包括单核苷酸变异/缺失、拷贝数变异以及线粒体变异,其中COL4A1基因发现了最多的P/LP单核苷酸变异(SNVs)。此外,本项研究还将脑瘫患者与儿科对照组进行了比较,以确立新生突变率和遗传负荷分析的基准,发现新生有害变异与与神经系统相关的基因之间存在关联。本篇文章强调,脑瘫是最常见的儿童起始期身体残疾,经常伴随认知和行为障碍等额外发展影响。研究突显了遗传因素对脑瘫的重要影响,尤其是在没有明显产前、产时或产后病理因素、足月出生以及脑部影像学正常的情况下。研究强调了脑瘫的多因素本质,涉及遗传变异与环境因素的复杂交互作用。该研究的结果支持在脑瘫的诊断流程中引入全基因组测序,以识别包括罕见变异和线粒体变异在内的广泛遗传变异。同时表明,遗传测试有助于深入了解脑瘫的病因,改善家庭咨询,并指导针对性治疗。
3.
2021, Nature Genetics. DOI: 10.1038/s41588-020-00769-9
2024-02-29 21:01:00
#paper A quantitative genomics map of rice provides genetic insights and guides breeding, Nature genetics,01 February 2021, doi.org/10.1038/s41588-020-00769-9. 这篇文章先收集水稻中各种性状前人已经定位的QTL,对QTL区间内的关键功能变异位点锚定到水稻基因组精确的位置上,获取了一个包含348个变异位点和562个等位基因的分子图谱(QTN)。然后对另外收集的404份种质材料,构建包含前面鉴定的等位基因的数据库,方便后人进行遗传改良过程亲本的选择。作者有对基因变异的遗传效应进行评估,来鉴定变异位点的效应方向和量化变化的强弱关系。利用水稻QTN图谱和遗传图,论文作者系统分析了水稻基因组中存在的遗传累赘,并针对杂交-回交-自交、群体样本量、导入位点数等各类情形进行了大数据仿真模拟,获得了育种设计路线的优化参数。这篇文章对我与现在处理大量的小麦GWAS得到的显著的SNP位点,如何进行量化管理,形成对育种家有用的数据很有启发。
4.
2023, Nature Genetics. DOI: 10.1038/s41588-023-01540-6
2024-02-29 10:51:00
Choo, ZN., Behr, J.M., Deshpande, A. et al. Most large structural variants in cancer genomes can be detected without long reads. Nat Genet 55, 2139–2148 (2023). https://doi-org-443.webvpn.las.ac.cn/10.1038/s41588-023-01540-6 短读测序(SRS)普遍应用于癌症基因组学研究,但SRS对于检测癌症结构变异(SVs,包括拷贝数改变和重排)的灵敏度有限,特别是大型染色体结构改变,这是因为人类基因组中有许多同源序列。本研究分析了短读全基因组中的“松散末端”——相邻DNA片段之间质量平衡的局部违反,用于检测短读测序遗漏的SVs。作者在1,330个高纯度癌症全基因组的松散末端景观中,发现大多数大于10kb的克隆SVs在人类基因组87%的区域内可以被短读测序完全解析,并且可以准确检测拷贝数。值得注意的是,一些松散末端代表新端粒,可将其作为替代性端粒延长表型的标志,以上发现通过还38例乳腺癌和黑色素瘤病例的长读长测序得到验证。本项研究的结果表明,异常同源重组不太可能驱动大多数大型癌症SVs,总得来说,全基因组SRS数据中的质量平衡分析提供了癌症染色体结构的一个出人意料的完整景象。("松散末端"是指那些在短读测序数据中没有找到匹配的断点末端。这些末端可能是因为基因组重排事件而产生的,这些事件将本不相连的DNA片段的末端连接在一起,形成了新的结合点)
5.
2024, Nature Genetics. DOI: 10.1038/s41588-023-01626-1
2024-01-31 19:56:00
#paper Feng, Y., Xie, N., Inoue, F. et al. Integrative functional genomic analyses identify genetic variants influencing skin pigmentation in Africans. Nat Genet (2024). https://doi.org/10.1038/s41588-023-01626-1. 肤色是人类群体间一个显著的差异性状,具有高度遗传性的复杂性状,受到数百个基因位点的影响,其遗传基础尚未完全阐明。本篇文章作者采用了综合的功能基因组学分析方法,揭示了影响非洲人群肤色的遗传变异。该研究团队通过全基因组关联分析(GWAS)和自然选择扫描,鉴定了与肤色相关的单核苷酸多态性(SNP),利用大规模平行报告基因检测技术(MPRA),他们测试了这些SNP的调控活性。作者进一步使用 Hi-C 和 H3K27ac HiChIP 技术,构建了高分辨率的染色质相互作用图谱,以确定这些SNP的潜在靶基因。该研究通过荧光素酶报告基因检测、CRISPR基因编辑、转录组分析和黑色素丰度检测等技术,发现MITF 附近的 rs111969762、LEF1 附近的 rs17038630 和 TRPS1 附近的 rs11985280,这三个Di-SNP均能显著影响增强子活性及其靶基因的表达,可能对桑人皮肤色素的适应性进化发挥了作用。总得来说,本项研究发现了多个新的影响黑色素细胞中黑色素水平的新基因,这些发现有助于深入理解人类肤色的遗传机制,并为研究其他复杂性状的遗传因素提供了有价值的方法论。
6.
2020, Nature Genetics. DOI: 10.1038/s41588-020-00712-y
2024-01-31 09:45:00
#paper doi: 10.1038/s41588-020-00712-y Nature Genetics, 2020, CHESS enables quantitative comparison of chromatin contact data and automatic feature extraction。本文介绍了一种基于计算机视觉中结构相似度(SSIM)的Hi-C数据相似度度量和结构变化区域的搜索算法,通过在基因组上进行滑窗计算,该算法不仅能基于Hi-C数据计算出两个样品在全基因组水平下染色质空间构象的相似程度,更能通过局部计算寻找出存在显著染色质空间构象变异的区域。该算法不仅可以进行同一物种内的比较,也可以进行跨物种比较。且对测序深度不敏感。本文将计算机视觉中的很多降噪/特征提取/形态学处理技术引入到了Hi-C相互作用图谱的处理中,对计算机上视觉技术在染色质空间构象数据的分析中的应用有重要参考价值。
7.
2023, Nature Genetics. DOI: 10.1038/s41588-023-01452-5
2023-07-25 00:17:00
#paper doi:10.1038/s41588-023-01452-5. Nature Genetics, 2023, Crosstalk between RNA m6A and DNA methylation regulates transposable element chromatin activation and cell fate in human pluripotent stem cells. 这篇文章开发了一种名为CARGO-BioID的方法,基于CRISPR技术 和 蛋白质邻位连接技术(Proximity Ligation Assay,PLA),能够抓取与基因组上特定转座元件(Transposable elements,TEs)区域序列相结合的蛋白,并通过质谱和ChIP-seq等实验,对这些蛋白进行鉴定和定量检测。文章以LTR7/HRV-H为目标,这是个灵长目特有的TE序列,通过上述技术方法,识别出与之结合的蛋白,其中包括 YTHDC2 和 TET1 这两个蛋白,前者是RNA m6A甲基化的读取器(reader),后者则是DNA 5mC甲基化的去甲基酶。随后,文章又利用一系列细胞实验,证实了这两个蛋白在该基因组区域上的生物学作用,包括相应的RNA甲基化与DNA甲基化之间的相互作用(crosstalk)、它们对TE活性的调控、以及对hPSC(人多能干细胞)分化命运的影响等。
8.
2023, Nature Genetics. DOI: 10.1038/s41588-023-01339-5
2023-03-27 11:42:00
#paper doi:https://ma.x-mol.com/paperRedirect/1639426668090503168 Thymidine nucleotide metabolism controls human telomere length 人类的端粒长度与寿命和严重疾病有关,但端粒长度的遗传决定因素仍未完全确定。在这里,我们进行了全基因组 CRISPR-Cas9 功能性端粒长度筛选,并将胸苷 (dT) 核苷酸代谢确定为人类端粒维持的限制因素。使用 CRISPR-Cas9 的靶向基因破坏揭示了胸苷核苷酸代谢途径中的多个端粒长度控制点:通过删除编码核胸苷激酶 ( TK1 ) 的基因减少 dT 核苷酸回收或通过敲除胸苷酸合酶基因 (TYMS )从头产生端粒长度减少,而脱氧核苷三磷酸水解酶编码基因SAMHD1失活延长的端粒。值得注意的是,单独补充 dT 可通过细胞中的端粒酶驱动端粒的稳健延伸,并且三磷酸胸苷在体外以底物非依赖性方式刺激端粒酶活性。在源自遗传性端粒生物学障碍患者的诱导多能干细胞中,补充 dT 或抑制SAMHD1可促进端粒恢复。我们的结果表明胸苷代谢在控制人端粒酶和端粒长度方面的关键作用,这可能对致命的退行性疾病患者具有治疗作用。
9.
2023, Nature Genetics. DOI: 10.1038/s41588-022-01283-w
2023-01-31 19:16:00
#paper # De novo genome assembly and analyses of 12 founder inbred lines provide insights into maize heterosis, Nature Genetics,16 January 2023,doi.org/10.1038/s41588-022-01283-w.玉米是三大粮食作物中杂种优势研究最多的物种,只是证明玉米存在杂种优势,但是关于对不同的育种目标对父母本的选择还没有文章说明,所以作者想对现在的骨干亲本组装想鉴定发现前人杂种优势形成的缘由。作者首先通过进化树分析对现在玉米常用的350自交系进行分析,对进化树每个分支上选取目前世界范围内广泛使用的12个骨干自交系,通过三代测序组装高质量基因组,同时结合玉米中之前已经发表的B73和Mo17基因组,构建了温带玉米核心育种种质泛基因组。作者对14个材料之间进行基因组比较分析发现存在广泛的遗传变异,通过对对玉米中现在 常用的自交系350份对花期、穗行数、穗粒数等表型进行鉴定和关键基因的单倍型分析,发现结构变异对杂种有事的形成和表型分化具有重要的贡献。通过对131份自交系雌穗的转录组数据分析,鉴定到306,868个调控基因表达的顺式eQTL,并挖掘到了一批调控玉米雄穗分枝数、穗位高及穗腐病抗性相关的候选基因及其关键结构变异;进一步结合14 个自交系的双列杂交群体 (91个F1)及3个环境的表型数据分析发现,玉米杂种优势与双亲基因组间结构变异的数量呈显著正相关,而与双亲基因组间共线性程度呈显著负相关,说明玉米杂种优势与双亲在全基因组水平的遗传互补性密切相关,为杂种优势的遗传互补模型提供了强有力的支持。同时结合遗传和分子生物学证据,挖掘到了ZmACO2 (编码一个乙烯合成酶)和ARGOS1 (ZAR1, 编码一个乙烯信号传导相关蛋白) 2个关键产量杂种优势位点,证明了其以超显性效应发挥作用。
10.
2022, Nature Genetics. DOI: 10.1038/s41588-022-01223-8
2023-01-06 22:21:00
#paper doi: 10.1038/s41588-022-01223-8 Nature, 2022, Enhancer-promoter interactions and transcription are largely maintained upon acute loss of CTCF, cohesin, WAPL or YY1。染色质空间构象对基因表达的调控模式目前依然是表观遗传学中一个有争议的话题,在本文中,作者快速降解了几个维持与调控染色质空间构象的重要因子(CTCF,cohesin,YY1)并测量了他们对染色质空间构象和基因表达谱的冲击。结果显示降解这些因子主要影响结构性染色质环,对启动子-启动子环或启动子-增强子环的影响有限,降解也不大范围改变基因表达谱。进一步,作者通过活细胞成像技术对YY1的结合动态进行了追踪,论证了YY1与DNA的结合是动态的且大部分YY1处于游离状态。进一步,作者论证了cohesin的敲除影响YY1的结合位点识别效率。本文中以下两个观点是值得注意的:1. 启动子-启动子环/启动子-增强子环与连接TAD边界的结构性染色质环的形成机理/对基因表达谱的影响是不同的;2. Cohesin敲除不仅直接破坏染色质构象,且可通过影响YY1的结合效率发挥间接作用,类似多效性机制也可能出现在其他因子上。
11.
2010, Nature Genetics. DOI: 10.1038/ng.592
2022-10-26 20:33:00
#paper doi:#paper doi:doi:10.1038/ng.592, OsSPL14 promotes panicle branching and higher grainproductivity in rice.作物产量三要素主要是亩穗数、穗粒数和千粒重。提高产量主要是提高三要素之间的协同作用。水稻的第二次“绿色革命”是通过降低株高来增加了水稻的产量。而现在有人认为在水稻中IPA这个基因是新型的"绿色革命"基因。该基因能够能够在水稻的生殖期通过在水稻幼穗内高表达促进水稻穗分枝和籽粒产量。小麦中关于SBP蛋白的研究有很多,通过同源blast,在小麦中也鉴定到了IPA的同源基因。文章在2017年发表在《Plant Physiology》“Functional conservation and divergence among homoeologs of TaSPL20 and TaSPL21, two SBP-box genes governing yield-related traits in hexaploid wheat”,作者发现普通小麦部分同源基因TaSPL20和TaSPL21在小麦长期的驯化和遗传改良过程中产生功能分化,其优异的自然变异在我国小麦育种进程中受到了定向选择并被广泛应用,但是这个文中中验证基因由于当初小麦转基因比较难,文中中验证是在水稻中进行的,证明该基因增加了籽粒大小,从而增加了产量。如果是在小麦中验证会更好。
12.
2017, Nature Genetics. DOI: 10.1038/ng.3972
2022-07-31 16:40:00
#paper doi:10.1038/ng.3972 The draft genome of tropical fruit durian (Durio zibethinus) 这是一篇癌症研究所,发表在2017年的Nature Genetics上的关于榴莲(品种是猫山王)基因组组装草图的文章。(不务正业)文章介绍了拼接方法和组装完整性与正确性验证的思路,有一定的参考意义。 文章还用转录组测序,将猫山王、金枕和小猫山王三个品种,与其他水果做了RNA测序,通过富集分析差异比较,发现了榴莲与其他水果气味差异的途径,同时也分析了不同榴莲品种之间味道和气味差异的控制途径,以及连个基因组与转录组分析表明榴莲气味与果实成熟之间存在潜在关联。 看完这个我就在想还有哪些贵的水果还没测基因组的
13.
2018, Nature Genetics. DOI: 10.1038/s41588-018-0129-5
2022-06-30 22:15:00
#paper 10.1038/s41588-018-0129-5。Nature Genetics。2018。Genetic identification of brain cell types underlying schizophrenia。貌似是第一批利用单细胞转录组来定位遗传学研究积累的候选致病基因富集在哪些细胞类型。这有利于进行更细致的机制研究。
14.
2022, Nature Genetics. DOI: 10.1038/s41588-022-01075-2
2022-06-16 00:40:00
#paper doi:10.1038/s41588-022-01075-2 Nature Genetics, 2022, Allelic imbalance of chromatin accessibility in cancer identifies candidate causal risk variants and their mechanisms. 这又是一篇只有两位作者署名的论文。如今,司空见惯了一篇文章动辄好几十位甚至成百上千位作者的情况,见到这类一两位作者“单打独斗”的作品,还是挺佩服的。从这篇文章,我学到个新词“调节组(regulome)”;相应地,其关联分析方法,被称为“regulome-wide associations study (RWAS)”。这篇文章还有个特点,它并未通过湿实验产出新数据,而是完全使用公开数据进行分析,包括结果验证,也是在公共数据库中进行。从概念到方法上进行创新,而成果发表到Nature子刊上,挺值得学习的。作者使用了来自TCGA的406例ATAC-seq数据,涵盖23个不同癌种,识别出7262个胚系allele-specific accessibility QTLs (as-aQTLs),即把染色质开放程度当做一种数量性状来研究,这个aQTL也是仿照eQTL提出的概念,的确很有意思。而通过RWAS,在各个癌种中鉴别出与癌症发生风险相关的as-aQTL位点,且发现它们在癌症风险遗传力方面的富集度甚至优于其他功能注释。这不仅实现了对非编码的“垃圾DNA(junk DNA)”区间的功能研究和解释,也开辟了肿瘤治疗的新思路,即针对这些调控区间及其相关机制来开展治疗。
15.
2022, Nature Genetics. DOI: 10.1038/s41588-022-01082-3
2022-06-13 05:47:00
#paper doi:10.1038/s41588-022-01082-3 Nature Genetics, 2022, Genomic analysis defines clonal relationships of ductal carcinoma in situ and recurrent invasive breast cancer. 本文研究导管原位癌(DCIS)。该疾病常见于乳腺癌筛查,即使经过治疗,也仍然有小部分患者会恶化复发成为浸润性乳腺癌。本文试图研究,恶化的这些患者,是否都来自原发性DCIS的复发克隆,亦或仅是新发的无关疾病。为此,本研究纳入了129对DCIS复发病例样本(即原位DCIS样本和复发样本;同时也包含匹配的癌旁对照组织),通过开展全外显子组测序、SNP芯片检测或靶向基因组panel测序(这里技术平台方法存在差别,是因为样本及其实验,分别来自和开展于荷兰、英国和美国的三家不同单位),进行基因组突变分析和拷贝数变异分析。同时也从中选取了4例病例,将其原发与复发组织,分别进行解离并开展单细胞基因组测序。针对这两种策略,都分别进行了克隆演化分析,最终确认并非所有同侧浸润性乳腺癌都与先前的 DCIS 有克隆相关性,其中有约五分之一其实为新发原发性癌症。此结果也在更大范围且更详细的程度上,验证了前人的研究结果。
TOP