响马读paper

一个要求成员每月至少读一篇文献并打卡的学术交流社群

本页面显示发表在 Nature Communications 杂志的文献。 当前共有 33 篇文献,本页显示第 1 - 20 篇。

1.
2024, Nature Communications. DOI: 10.1038/s41467-024-44761-x
2024-02-29 10:20:00
#paper doi: 10.1038/s41467-024-44761-x Nature communications, 2024, Orchestrating chromosome conformation capture analysis with Bioconductor。全基因组染色质构象捕获技术(Hi-C)及其衍生技术是当前研究真核细胞染色质空间构象的最主流技术手段,基于其的研究所涉及的大体量,多模、多目标的多组学分析问题对生物信息技术提出了许多重大挑战。本文系统性的总结了过去十几年来依托R语言和Bioconductor平台开发的一系列Hi-C及衍生数据分析工具包。按分析流程详细描述了数据的获取和预处理,结果的导入导出,核心数据结构,各拓扑结构单元的识别,数据可视化等数据分析的方方面面。本文的总结对学习Hi-C数据分析有重要参考价值,同时也对定制化的分析流程开发有指导意义。
2.
2022, Nature Communications. DOI: 10.1038/s41467-022-28421-6
2023-12-31 22:02:00
#paper doi: 10.1038/s41467-022-28421-6. Machine learning-based integration develops an immune-derived lncRNA signature for improving outcomes in colorectal cancer. Nat Commun. 2022 Feb 10;13(1):816. 在该项研究中,作者开发了一种基于机器学习的整合程序,用于构建共识免疫相关lncRNA特征(称为IRLS)。整体思路为:免疫浸润共识簇的开发和验证-鉴定源自免疫浸润模式的lncRNA模块-101种机器学习算法筛选最佳预测模型。通过对模型的评估发现,IRLS和AJCC分期的结合可以进一步提高模型的预测能力。作者还通过免疫相关lnRNA预后评分模型与已知发表了的基因signature多套数据集中进行比较分析,计算当前癌症类型中已发表的signature的C-index,重点体现本研究中lncRNAs的优势。 这篇免疫相关lncRNA的文章值得我们学习的最大亮点是,不像常规预后模型文章那样只用2-4种机器学习算法然后取交集(cox、lasso、RF等等),而是通过整合了10种不同的机器学习算法(包括Support Vector Machine (SVM), Least Absolute Shrinkage and Selection Operator (Lasso), Gradient Boosting Machine (GBM), Random Forest, Elastic Net, Stepwise Cox, Ridge, CoxBoost, Super Partial Correlation (SuperPC), and Partial Least Squares with Cox regression (plsRcox)),并评估了101种算法组合这些机器学习算法,直至筛选出最优的预后模型。
3.
2023, Nature Communications. DOI: 10.1038/s41467-023-44011-6
2023-12-31 13:31:00
#paper Theta mediated dynamics ofhuman hippocampal-neocortical learning systems in memory formation and retrieval https://doi.org/10.1038/s41467-023-44011-6 本研究探讨了人类海马-皮层学习系统在记忆编码和提取过程中的θ节律动力学。研究结果表明,θ节律在记忆形成和检索过程中起着重要的调节作用,并且海马和新皮质之间存在信息传递的动态变化。这些发现对于理解记忆的神经机制和相关疾病具有重要意义。具体而言,文章关心三个研究问题:1)在记忆编码和检索过程中,海马和新皮质之间的信息传递方向是如何的?2)在不同条件下,海马和新皮质之间的信息传递是否存在差异?3)Theta频率范围内的神经振荡是否在海马-新皮质学习系统中发挥重要作用?作者记录了8个颅内病人数据,通过模式分离任务(让被试判断old,lure,new)中的电生理信号来揭示4-5hz的θ节律分别在编码和提取过程的作用,以及这一节律如何贡献于海马和皮层的信息交互。结果发现,4-5hz的θ节律在模式完成和模式分离中表现不同,海马和新皮质无论在模式完成还是模式分离还是编码提取阶段都表现出双向信息交流。但这几种条件下存在一定的偏向性,如模式分离(即能够区分相似的项目)4 - 5hz介导了新皮层→海马方向偏差,而如果4-5hz可以在编码阶段介导海马→新皮层方向偏差,那么被试在提取阶段可以更好的识别学过的项目。总体来说海马和新皮层的交互在记忆编码提取以及模式分离和模式整合等不同阶段和条件下展现出了非常动态性的过程,4-5hz的θ震荡在其中起到一定的作用。
4.
2023, Nature Communications. DOI: 10.1038/s41467-023-43077-6
2023-12-30 19:00:00
#paper Transcriptome-wide association analyses reveal the impact of regulatory variants on rice panicle architecture and causal gene regulatory networks, Nature Communications, 18 November 2023, https://doi.org/10.1038/s41467-023-43077-6 。利用转录组和全基因组关联分析鉴定控制水稻穗型结构的基因。研究人员利用275份水稻1-2mm幼穗转录组数据,鉴定出表达水平与性状相关的基因,后续又对鉴定到的显著的基因和受小效应位点影响,对等位基因差异选择影响基因的表达和穗部性状,后续利用顺式表达成分和和反式表达成分来构建了水稻穗发育的基因表达调控网络。
5.
2023, Nature Communications. DOI: 10.1038/s41467-023-41380-w
2023-09-30 22:08:00
#paper Geissmann, L., Coynel, D., Papassotiropoulos, A., & de Quervain, D. J. (2023). Neurofunctional underpinnings of individual differences in visual episodic memory performance. Nature Communications, 14(1), 5694. https://doi.org/10.1038/s41467-023-41380-w 情景记忆在个体之间存在着很大的差异。以往核磁研究的证据证明了在群体水平上可以成功编码记忆的脑区,但是在解释个体差异方面的脑区和机制还并未阐明。作者利用大数据集,分析了1498名被试在图片编码任务中的核磁结果,他们发现海马体、眶额皮层和后扣带皮层反应性的个体差异解释了情景记忆表现的个体差异。而枕叶外侧皮层等,与成功的记忆编码有关,但与个体的记忆差异无关。这个研究很有趣,因为一直以来关于记忆的研究都集中于怎么记住,很少关注个体差异,对于个体差异的关注对于理解个体记性好坏具有一定的启示作用。
6.
2023, Nature Communications. DOI: 10.1038/s41467-023-41452-x
2023-09-30 11:38:00
#paper doi: 10.1038/s41467-023-41452-x. Belliveau NM, et al. Whole-genome screens reveal regulators of differentiation state and context-dependent migration in human neutrophils. Nat Commun. 2023 Sep 18;14(1):5770. 中性粒细胞是人类数量最多的淋巴细胞,主要通过迁移到组织损伤和感染发生部位为机体提供早期的先天性免疫应答。在分子信号的刺激下,中性粒细胞的迁移速度能达5-20 um/min。那么,在迁移过程,中性粒细胞分化和出现表型多样性的机制是什么?它们是如何适应和改变目的环境?本研究通过全基因组CRISPR敲低筛选技术(CRISPRi screen),首先发现mTORC1信号通路是人HL-60分化的类中性细胞系分化向迁移状态转化的关键通路。接着通过定向敲低该通路的基因,定位到ATIC基因。ATIC基因主要通过影响中性粒细胞能量代谢驱动迁移。此外,作者发现中性粒细胞直接的趋化作用和间接的化学动力学行为具有非常强的基因表达相关性。以及黏附依赖和非黏附依赖迁移行为之间存在数百个差异基因。总之,本研究为CRISPRi screen应用于细胞时序行为提供了很好的研究范式。有趣的是,本研究对活细胞示踪图像数据提供了一个定量细胞迁移持久性的算法模型(贝叶斯推断)。
7.
2023, Nature Communications. DOI: 10.1038/s41467-023-41669-w
2023-09-28 21:40:00
#paper A de novo evolved gene contributes to rice grain shape difference between indica and japonica, Nature Communications, 22 September 2023. doi.org/10.1038/s41467-023-41669-w. 该论文首先对粳稻和梗稻亚群组成的群体对籽粒长度和籽粒重量分别进行全基因组关联分析,关联分析的结果表型在9号染色体上都具有GSE9这个位点。其中在这个基因附近具有15个基因,对粳稻和梗稻亚群分别进行转录组鉴定其基因表达量后,最终缺点给一个ORF家族的基因,认为该基因是GSE9。后续实验验证发现该基因在粳稻中花11和日本晴背景下,敲除GSE9导致粒长显著增加、粒宽减小、长宽比增大;而过表达该基因导致粒长和粒宽均显著增加,表明水稻GSE9基因参与水稻粒型的调控。GSE9在稻属物种O. sativa、O. rufipogon、O. barthii、O. glumaepatula和O. longistaminata中存在高度同源的DNA序列,且仅在大部分粳稻品种和少数普通野生稻(O. rufipogon)中具有编码序列特征,而在其它稻属物种中的起始密码子位点为GTG,并非真核生物的起始密码子ATG,表明该基因可能通过de novo起源方式最早起源于普通野生稻的原非编码区,并传递到绝大部分粳稻品种中。对GSE9基因区段的序列分析,发现绝大部分粳稻品种具有起始密码子ATG,而绝大部分籼稻品种则不具备起始密码子(起始密码子位点为GTG,gse9),且序列变异表现出明显的籼粳亚种间分化特征。进一步结合系统进化树和单倍型网络分析,发现gse9型籼稻和GSE9型粳稻独立起源于Or-I和Or-III型普通野生稻。关于de novo origination在小麦重的研究还没有人有一个完整的基因list出来,也查看该专业祖师爷龙漫远的文章,拟南芥重从头起源的基因讲解的也很精彩。
8.
2023, Nature Communications. DOI: 10.1038/s41467-023-41690-z
2023-09-27 09:43:00
#paper doi:10.1038/s41467-023-41690-z. 2023, Nature Communications, Genome-wide enhancer-gene regulatory maps link causal variants to target genes underlying human cancer risk. 这篇文章使用了一种名为 Activity-by-Contact (ABC) 的计算方法,在20个癌种的已发表的多组学测序数据中进行分析,识别出54万多个“增强子-基因调控(Enhancer-gene regulation)”关系对,为解释这其中的非编码区突变功能提供了基础。此后又入组10例结直肠癌(CRC)临床样本,也进行多组学检测和上述调控关系对的鉴别,并将发现结果放到数万例的大规模人群中进行验证。此外,还进一步对其中发现的与CRC风险相关的调控区突变位点rs4810856,使用细胞系、小鼠模型等,在基因表达、蛋白表达等层面,分别进行了功能上的验证。整篇文章从逻辑上看并不特别连贯,但工作量比较大,更像是一开始入组了10例癌症患者的临床样本,做了多组学测序,之后在分析数据结果基础上不断扩展完善,最后拼凑出来的故事。
9.
2023, Nature Communications. DOI: 10.1038/s41467-023-38347-2
2023-07-31 23:35:00
#paper doi:10.1038/s41467-023-38347-2 Nat Commun, 2023, A general model to predict small molecule substrates of enzymes based on machine and deep learning, 基于机器学习和深度学习的酶小分子底物预测通用模型。可以预测任意1种酶和大约1400种小分子是否为其底物的通用模型。帮助减少确定特定酶的底物分子的筛选范围,帮助降低实验成本。缺点是目前有5%的假阳性率,因此比较适合预测单一酶的候选底物,不适合预测基因组规模代谢模型中的所有酶的候选底物。
10.
2023, Nature Communications. DOI: 10.1038/s41467-023-40189-x
2023-07-31 20:26:00
#paper Two complementary genes in a presence-absence variation contribute to _indica_-_japonica_ reproductive isolation in rice,Nature Communications,28 July 2023. doi.org/10.1038/s41467-0. 亚洲的栽培稻包括粳稻和梗稻两个亚种,两个亚种之间在形态、生理以及基因水平上存在显著差异,不同种之间的遗传差异会产生强大的杂种优势,而两个亚种之间的生殖隔离也会导致育性下降,结实率降低。该文章通过对两个亚种品种的PAV找到了一个粳稻杂种不育基因座Se,该基因座包含了两个相邻且具有互补效应的基因ORF3和ORF4. ORF3是编码一个具有毒性作用的孢子体花粉的杀手,而ORF4则以配子体方式保护花粉。而粳稻和籼稻杂交F1种。粳型单倍型的花粉由于缺乏ORF4的保护,会受到籼型ORF3的毒性作用导致花粉败育。另外作者又想追溯下Se位点的进化关系,利用14个稻属847分水稻进行基因座的PAV验证,分析。表明Se基因座的出现与AA基因组稻属物种的进化相关。单倍型分析结果表明,Se基因座共包含37种单倍型。根据ORF3_和ORF4的功能和来源,这37种单倍型又可以被进一步得分为5个大类。其中有功能的ORF3以中等频率(74/236)在籼稻中保持,而大多数(132/148)粳稻都缺失了ORF3和ORF4,表明Se基因座的PAV促进了亚洲栽培稻籼粳亚种之间生殖隔离的形成,同时也支持了籼稻和粳稻是由不同的普通野生稻独立驯化而来的理论。同时这个基因座也是cell A natural gene drive system confers reproductive isolation in rice这篇文章定到的位点。CELL更详细的讲了这个基因的分子机理,主要是OPR3可以跟细胞中线粒体的核心功能蛋白互作,干扰线粒体产生能量后导致花粉败育。而ORF4和ORF3互作,使得ORF3不能与核心蛋白互作,解除破坏作用。且ORF3和ORF4形成的复合体可以通过自噬体细胞器进行讲解,彻底消除ORF3的作用。CELL也分析了该基因座的起源和进化,在祖先中不存在,主要是在亚洲的栽培稻祖先-普通野生稻中分化出ORF3和ORF4的功能。经过驯化后,被籼稻继承。
11.
2016, Nature Communications. DOI: 10.1038/ncomms13404
2023-07-31 19:35:00
#paper https://doi.org/10.1038/ncomms13404 Direct identification of clinically relevant neoepitopes presented on native human melanoma tissue by mass spectrometry 这篇研究采用高灵敏度质谱技术,对25名黑色素瘤患者的原发肿瘤组织进行了全面的免疫肽谱学分析,发现了近10万个肿瘤相关肽段。研究团队还首次直接鉴定了携带突变的肽段,其中11个突变肽段在患者样本中得到证实。这些突变肽段中有4个显示出免疫原性,能够诱导患者体内T细胞产生针对癌症的免疫反应。这表明直接通过质谱技术识别突变肽段是寻找个性化肿瘤免疫治疗靶点的有效方法。此外,研究还在未富集的样本中检测到磷酸化肽段,为未来研发癌症免疫治疗提供了潜在目标。虽然该方法灵敏度仍需改进,但研究结果为癌症免疫治疗提供了重要的启示和新方向。
12.
2023, Nature Communications. DOI: 10.1038/s41467-023-39131-y
2023-07-29 14:54:00
#paper Language network lateralization is reflected throughout the macroscale functional organization of cortex doi:10.1038/s41467-023-39131-y 半球偏侧化是人类大脑组织的一个基本特征。虽然大多数人表现出左半球语言优势,但相当一部分人口表现出反向偏侧化。利用来自HCP的双胞胎和家庭数据,本研究为语言偏侧化在大脑皮层宏观功能组织中的反映提供证据。分析表明,语言的侧化和梯度不对称在一定程度上是由遗传因素驱动的。这些发现为更深入地理解大脑半球偏侧化的种群水平变异和皮层组织的整体属性之间的起源和关系铺平了道路。
13.
2018, Nature Communications. DOI: 10.1038/s41467-018-04608-8
2023-06-30 15:00:00
#paper https://www.nature.com/articles/s41467-018-04608-8, Nature communication 2018, Exploring patterns enriched in a dataset with contrastive principal component analysis PCA(主成分分析)能够将高维数据映射到低维,是最常用的数据探索和可视化工具。然而PCA(以及其他降维方法例如t-sne, umap)每次只能分析一个数据集。当处理多个数据集,尤其是寻找某数据集特有的信号时,使用PCA就需要人工比较不同数据集的投影来试图寻找数据集间的相似和不同点。这篇文章提出了解决此类问题的一种简单有效的降维方法:对比PCA。该方法旨在寻找一个投影,使得目标数据集和背景数据集的差距尽可能大,从而富集目标数据集特有的信号。该方法原理与实现和PCA类似,后续实验验证了其能有效发现那些被PCA忽视的目标数据集特有的信号。除此之外,文章还详述了该方法的理论基础和几何表示,并指出其可以运用在很多PCA的使用场景中。
14.
2023, Nature Communications. DOI: 10.1038/s41467-023-35967-6
2023-06-25 23:08:00
#paper doi https://doi.org/10.1038/s41467-023-35967-6,Nature Communications,2023, Goal-oriented representations in the human hippocampus during planning and navigation.在之前的研究中,海马被认为与长时记忆、位置表征相关,然而,最近认知和系统神经科学的研究表明,海马可能通过形成认知地图支持计划、想象和导航。在本研究中,研究者探究人类在目标导向导航任务期间的海马活动模式,以研究如何将上下文和目标纳入导航计划的构建和执行中。在计划阶段,相同背景和目标的路线之间的海马模式相似性增强。在导航阶段,海马前瞻性激活。
15.
2023, Nature Communications. DOI: 10.1038/s41467-023-36948-5
2023-05-31 23:47:00
#paper doi: 10.1038/s41467-023-36948-5. Yang B, et al. CTCF controls three-dimensional enhancer network underlying the inflammatory response of bone marrow-derived dendritic cells. Nat Commun. 2023 Mar 8;14(1):1277.  树突状细胞是一类重要的抗原呈递细胞,参与先天性和适应性免疫的精密调控过程。激活的树突状细胞能够通过上调主要相容性复合物、共刺激分子和多种促炎细胞因子调节淋巴细胞的激活和分化。然而,树突状细胞的异常激活可能会导致多发硬化等自身免疫性疾病。因此,深入研究树突状细胞激活的内在机制对相关疾病治疗策略的制定具有重要意义。本研究结合HiC、ChIP-seq和RNAseq三种组学技术,在三维基因组层面揭示了骨髓来源的树突状细胞激活重要机制。研究结果显示,染色质loop结构和增强子-启动子互作重编程诱导树突状细胞激活;树突状细胞CTCF缺失后会引起粒细胞-巨噬细胞集落刺激因子(GM-CSF)介导的JAK2/STAT5信号通路,最终导致NF-kB复合物失活;CTCF是NK-kB依赖染色质互作和增强与Th1和Th17细胞分化相关的促炎细胞因子表达的关键分子。
16.
2023, Nature Communications. DOI: 10.1038/s41467-023-37804-2
2023-04-30 23:59:00
#paper A distributed and efficient population code of mixed selectivity neurons for flexible navigation decisions https://doi.org/10.1038/s41467-023-37804-2 这篇文章研究了虚拟导航背后皮层区域和神经活动模式,根据不同线索匹配切换不同导航策略,通过编码电流和记忆视觉提示混合介导导航开关,提供导航决策灵活性。
17.
2023, Nature Communications. DOI: 10.1038/s41467-023-36605-x
2023-02-28 21:39:00
#paper https://doi.org/10.1038/s41467-023-36605-x Multivariate genomic architecture of cortical thickness and surface area at multiple levels of analysis 最近在影像遗传学方面的工作表明,皮层区域内皮层厚度(CT)和表面积(SA)的遗传重叠程度很高。该研究通过应用基因组结构方程模型(Genomic SEM)对这一遗传关系的多变量系统进行建模,并对CT和SA的五个脑部基因组因素以及一个捕捉所有脑区遗传重叠的一般因素进行解析。我们通过证明该模型在独立样本中的普遍性来验证这些因素,并表明这些因素与脑皮层的生物和功能相关分区相一致。我们应用分层基因组SEM来确定特定类别的基因(如神经元细胞类型),这些基因与脑区特定亚群的多态性成正比关系。最后,研究了与精神和认知相关的遗传关系,发现认知功能的广泛与SA的一般因素有关,而与精神方面的关系不明显。这些分析提供了脑皮层两个关键特征的多变量基因组结构的关键见解。
18.
2022, Nature Communications. DOI: 10.1038/s41467-022-35320-3
2023-01-31 23:13:00
小W:
#paper doi:https://doi.org/10.1038/s41467-022-35320-3 Tumor fractions deciphered from circulating cell-free DNA methylation for cancer early diagnosis. Nat Commun 13, 7694 (2022) 本文是清华大学团队开发的使用 cfDNA 甲基化特征来构建SRFD-Bayes诊断模型,通过去卷积混合甲基化特征来估计cfDNA的肿瘤的起源组织 (TOO),用于预测原发性肿瘤的位置和对癌症早期诊断。本文分为三个部分,使用肿瘤和正常样本甲基化数据模拟 cfdna 数据;甲基化标记物选择,使用半参考反卷积(SRFD)从血浆cfDNA甲基化谱中学习的参考数据库, 构建SRFD-Bayes 模型;在早期患者和健康个体上验证时,该模型对癌症早期检测的敏感性为86.1%,对肿瘤定位的平均准确性为76.9%,特异性为94.7%。
19.
2022, Nature Communications. DOI: 10.1038/s41467-022-35237-x
2023-01-31 23:12:00
#paper doi:10.1038/s41467-022-35237-x Nat Commun., 2022, Sourcing thermotolerant poly(ethylene terephthalate) hydrolase scaffolds from natural diversity。将HMM方法与机器学习相结合,以鉴定PET水解酶,根据序列预测酶的最佳活性温度。从公开数据库获得序列和环境最佳生长温度(OGT),只保留OGT大于50℃的序列,对于没有OGT信息的序列,使用计算氨基酸特征的支持向量机方法训练机器学习模型(ThermoProt)来区分来自嗜热菌大于50℃的8000种蛋白和来自非嗜热菌的小于50℃的8000种蛋白。ThremProt表现出86.6%的准确率。选择了74种假定的耐热PET水解酶进行实验筛选。实验筛选出了23种热稳定酶,均未被报道,并且超过先前报道的36种酶的PET水解酶活性。
20.
2023, Nature Communications. DOI: 10.1038/s41467-022-35343-w
2023-01-30 16:03:00
#paper doi:https://doi.org/10.1038/s41467-022-35343-w Machine learning models to accelerate the design of polymeric long-acting injectables 2023年第一篇吸引我注意的计算生物学的论文。 这篇文章刚好提到我们最近的一个研究方向,不错不错,说明我司都踏在点子上了。 这篇文章主要是介绍了一种如何通过计算来设计长效药物结构的方法。虽然看内容,里面的计算工具和思想还是AI从业人员不难想到,通过AI学习长效药物的特征,从而预测新的药物结构释放效率。 但是揭示的结论确实和我司考虑的方向一模一样。 人类历史上很多药物都是马马虎虎上市的,有太多可以改进的地方了。 加油2023
TOP