文献收藏与分享平台

1.

李翛然 (2026-02-28 14:54):

#paper MiMiCPy-FM: A User-Friendly Force Matching Tool for Extending the Time Scale of QM/MM MD MiMiC Simulations. doi:10.1021/acs.jcim.5c03185 该工具基于通用 QM/MM 力场匹配方法构建，深度集成于 MiMiCPy 生态，支持命令行快速执行与 Python 库个性化调用双模式。其核心优势在于实现了 QM/MM 体系向经典分子动力学（MD）的无缝衔接，可自动完成 D-RESP 电荷分配与键合力场参数拟合，兼容有无共价 QM/MM 边界的复杂体系，直接输出 GROMACS 兼容拓扑文件。基于 MiMiCPy-FM 的力场匹配实施流程图性能验证表明，MiMiCPy-FM 在丙酮水溶液体系中达到同类方法拟合精度；在 Mg 基酶 IDH1 药理体系应用中。

Journal of Chemical Information and Modeling, 2026-2-20. DOI: 10.1021/acs.jcim.5c03185

MiMiCPy-FM: A User-Friendly Force Matching Tool for Extending the Time Scale of QM/MM MD MiMiC Simulations

翻译

Sachin Shivakumar, Giorgia Frumenzio, Francesco Musiani, Fabio Affinito, Emiliano Ippoliti, Bharath Raghavan, Giulia Rossetti, Davide Mandelli, Paolo Carloni

Abstract: No abstract available.

2.

李翛然 (2026-01-31 23:04):

#paper doi:10.1038/s41586-025-10014-0 Nature Advancing regulatory variant effect prediction with AlphaGenome。 AlphaGenome，这是一个能够统一解读 DNA 非编码“暗物质”的深度学习模型。该模型可直接输入长达 1 兆碱基对（1 Mb）‍ 的 DNA 序列，以单碱基分辨率同时预测数千种基因组功能信号（如染色质可及性、转录因子结合、剪接等）在性能上，AlphaGenome 在 24 项基因组轨迹预测任务中的 22 项，以及 26 项变异效应预测任务中的 24 项上达到了最先进水平。它能够准确预测非编码变异如何影响基因调控，例如成功解析了白血病相关癌基因 TAL1 附近变异的作用机制。我觉得他倒是和 kegg没有特别让我眼前一亮的。

IF:50.500Q1 Nature, 2026-Jan. DOI: 10.1038/s41586-025-10014-0 PMID: 41606153 PMCID:PMC12851941

Advancing regulatory variant effect prediction with AlphaGenome

翻译

Žiga Avsec, Natasha Latysheva, Jun Cheng, Guido Novati, Kyle R Taylor, Tom Ward, Clare Bycroft, Lauren Nicolaisen, Eirini Arvaniti, Joshua Pan, ... >>>

Abstract:

Deep learning models that predict functional genomic measurements from DNA sequences are powerful tools for deciphering the genetic regulatory code. Existing methods involve a trade-off between input sequence length and … >>>

翻译

3.

李翛然 (2025-12-30 22:45):

#paper Designing synthetic regulatory elements using the generative AI framework DNA-Diffusion. Nat Genet (2025).doi:doi.org/10.1038/s41588-025-02441-6DNA-Diffusion是一项基于扩散模型的生成式AI技术，旨在从头设计能精确控制基因表达的合成调控元件（如启动子、增强子）。该模型无需依赖已知模板或人工规则，通过在大规模基因组数据中学习，能够直接生成全新的DNA序列。其核心特点是条件可控，研究人员可以指定目标（如所需的基因表达强度、特定的细胞类型）来定向生成符合要求的序列。实验验证表明，DNA-Diffusion生成的序列在功能上有效：它们能在报告基因实验中展现出稳定且可调控的活性，部分序列还能在不同细胞类型中保持功能。与基于规则或其他AI生成方法相比，该模型在序列的功能性、稳定性和泛化能力上表现更优。例如，它能设计出将特定基因表达提升至超过天然保护性变异水平的序列。这项研究标志着合成生物学设计范式的一次重要转变——从“预测已有序列的功能”转向“直接生成满足需求的新序列”，为未来基因电路设计和基因治疗提供了强大的新工具。

Nature Genetics, 2025-12-23. DOI: 10.1038/s41588-025-02441-6

Designing synthetic regulatory elements using the generative AI framework DNA-Diffusion

翻译

Lucas Ferreira DaSilva, Simon Senan, Judith F. Kribelbauer-Swietek, Zain Munir Patel, Lithin Karmel Louis, Aniketh Janardhan Reddy, Sameer Gabbita, Jonathan D. Rosen, Zach Nussbaum, César Miguel Valdez Córdova, ... >>>

Abstract: No abstract available.

4.

李翛然 (2025-11-29 22:54):

#paper doi:10.1038/s41586-024-08427-x Computational design of cysteine proteases Baker真的是想教会这个世界怎么用AI设计蛋白质～该研究利用深度学习模型 RFD2‑MI 从头设计了具有催化活性的半胱氨酸蛋白酶，能够在序列特异性下切割肽链酰胺键。设计的酶展示出最高约 3 × 10⁷ 倍的速率提升（kcat/k_uncat），并通过晶体结构验证其与预测模型高度一致（Cα RMSD < 1.2 Å）。所有设计的折叠均为自然界未见过的新结构（TM‑score < 0.5），实验证实其热稳定性高（Tm > 80 °C）并在中性 pH 条件下保持活性。又是一个手把手教程～～

bioRxiv, 2025-11-22. DOI: 10.1101/2025.11.21.689808

Computational design of cysteine proteases

翻译

Abstract:

Abstract Despite advances in de novo enzyme design, success has been largely limited to low energy barrier model reactions. Amide bonds such as those linking amino acids along the peptide … >>>

翻译

5.

李翛然 (2025-10-31 13:28):

#paper The Evolving Quest for Chemical Understanding in the Quantum Age. doi: 10.1021/acs.jctc.5c01299 文章探讨了量子力学进入第二个世纪后理论化学与计算化学的范式转变。文章指出，传统基于轨道（如价键理论、分子轨道理论）和基于密度（如密度泛函理论）的方法虽为领域奠定了计算与概念基础，但机器学习和量子计算的出现引入了全新的表示、推理与理解范式。作者从本体论、认识论和涌现性视角回顾了过去一个世纪化学理解的发展，强调化学概念（如芳香性、电负性、反应性）并非仅还原为物理基本定律，而是作为连接化学理论与理解的关键支架涌现而来。文章提出一个从化学理论基本变量中获取化学理解的通用框架，并将其扩展至深度学习和量子计算领域，建议通过机器学习特征和量子比特分别挖掘新理解。文章倡导以“分层建模”（hierarchical modeling）替代传统的“多尺度建模”，因其能整合跨尺度抽象、捕捉涌现行为，并促进复杂层级系统的概念创新。最终结论认为，化学理解的未来不仅依赖于求解更复杂的物理方程，更需认识论转变，包括概念多元性、认识适应性和对分子系统多层本体结构的深入理解。该研究呼应了作者此前在《ACS Physical Chemistry Au》（2024年）中的观点，即机器学习和量子计算将推动化学概念理解的新范式，但需克服算法与硬件障碍

Journal of Chemical Theory and Computation, 2025-10-28. DOI: 10.1021/acs.jctc.5c01299

The Evolving Quest for Chemical Understanding in the Quantum Age

翻译

Shubin Liu

Abstract: No abstract available.

6.

李翛然 (2025-09-29 01:04):

#paper Predicting protein-protein interactions in the human proteome doi.org/10.1126/science.adt1630 David baker发表了一项由美国德克萨斯大学西南医学中心领衔的重大研究成果，研究团队成功构建了全球最全面的人类蛋白质相互作用（PPI）预测模型。该工作整合了30PB基因组数据，结合深度学习技术，系统鉴定了17,849组高置信度蛋白质互作关系，其中包括3,631组全新互作，为疾病机制解析及药物研发提供了重要分子蓝图。研究突破性地开发了omicMSA技术，显著增强共进化信号分析的灵敏度，并利用AlphaFold数据库训练新型网络RF2-PPI，实现较传统方法20倍的预测速度提升及90%的准确率。

Science, 2025-9-25. DOI: 10.1126/science.adt1630

Predicting protein-protein interactions in the human proteome

翻译

Abstract:

Protein-protein interactions (PPI) are essential for biological function. Coevolutionary analysis and deep learning (DL) based protein structure prediction have enabled comprehensive PPI identification in bacteria and yeast, but these approaches … >>>

翻译

7.

李翛然 (2025-08-30 11:09):

#paper Atom level enzyme active site scaffolding using RFdiffusion2 doi://10.1101/2025.04.09.648075 RFdiffusion2 是由 David Baker 团队开发的革命性蛋白质设计模型，专注于原子级酶活性位点的精准构建，实现了从催化机制到功能酶结构的端到端生成。以下是其核心功能及相比第一代（RFdiffusion）的突破性改进： ------ 核心功能 1. 原子级活性位点设计 ◦ 直接输入催化反应的关键原子坐标（如侧链功能基团、金属离子或底物），模型自动生成容纳该活性位点的完整蛋白质支架，无需预先指定残基类型、位置或构象（rotamer）。 ◦ 支持 "部分配体输入"：仅提供部分底物原子坐标，模型可补全未知构象，并控制小分子埋藏深度（通过原子级RASA条件）。 2. 多样性酶生成 ◦ 基于最小化反应机制描述（如DFT优化的过渡态几何），生成结构新颖且功能多样的酶，实验验证中仅需筛选 ≤96个设计即可获得高活性酶。 3. 广泛适用性 ◦ 成功应用于逆醛缩酶、半胱氨酸水解酶、金属水解酶等设计，其中锌水解酶的催化效率达53,000 M⁻¹s⁻¹，比此前设计高几个数量级。 ------ 相比RFdiffusion的五大突破 1. 原子级输入取代残基级输入 ◦ RFdiffusion 仅支持指定残基骨架（N-Cα-C），需人工枚举侧链构象和序列位置，计算量大且限制设计空间。 ◦ RFdiffusion2 直接接受原子坐标（如His的ND1原子），自动推断残基类型、构象和序列位置，极大提升自由度。 2. 无索引基序支持 ◦ 无需预先固定催化残基的序列编号（index），模型可自主分配位置，解决传统方法中指数级增长的搜索难题。 3. 流匹配（Flow Matching）框架 ◦ 替换传统扩散模型，训练更稳定、推理更高效，支持原子坐标与蛋白结构同步生成。 4. 条件控制能力增强 ◦ 新增 RASA条件（控制配体原子暴露度）、ORI条件（指定活性位点质心位置），实现活性位点埋藏深度与方向的精准调控。 5. 实验成功率显著提升 ◦ 在原子基序酶基准（AME）测试中，RFdiffusion2在 41/41个挑战任务中生成有效结构，而RFdiffusion仅成功 16/41个。 ◦ 生成的结构与天然蛋白相似度低（TM-score≤0.4），证明其高度创新性。

bioRxiv, 2025-4-10. DOI: 10.1101/2025.04.09.648075

Atom level enzyme active site scaffolding using RFdiffusion2

翻译

Abstract:

AbstractDe novoenzyme design starts from ideal active site descriptions consisting of constellations of catalytic residue functional groups around reaction transition state(s), and seeks to generate protein structures that can accurately … >>>

翻译

8.

李翛然 (2025-07-28 13:44):

#paper doi:10.1126/science.adv9817,Science,Sarah Lewis https://orcid.org/0009-0009-6484-0352, et al. Scalable emulation of protein equilibrium ensembles with generative deep learning 蛋白质功能依赖其动态构象变化（如结构域运动、局部解折叠），但现有技术存在瓶颈：静态模型局限：AlphaFold等仅预测单一结构，无法捕捉动态过程。传统方法缺陷：实验技术（冷冻电镜、单分子实验）通量低；分子动力学（MD）模拟计算成本极高（毫秒级模拟需数月GPU时间）。 BioEmu的核心创新微软团队提出BioEmu，一种基于生成式扩散模型的系统，实现高效、高精度蛋白质构象集合模拟：架构设计：融合AlphaFold的evoformer编码器与扩散模型，输入蛋白质序列，通过30–50步去噪生成三维构象集合。三阶段训练策略：预训练：使用聚类后的AlphaFold数据库学习构象多样性；微调：整合>200毫秒全原子MD数据（覆盖1100+CATH结构域），逼近热力学平衡分布；精调：引入PPFT算法，利用50万实验稳定性数据（ΔG/ΔΔG）优化模型与实验一致性。

Science, 2025-7-10. DOI: 10.1126/science.adv9817

Scalable emulation of protein equilibrium ensembles with generative deep learning

翻译

Sarah Lewis, Tim Hempel, José Jiménez-Luna, Michael Gastegger, Yu Xie, Andrew Y. K. Foong, Victor García Satorras, Osama Abdin, Bastiaan S. Veeling, Iryna Zaporozhets, ... >>>

Abstract:

Following the sequence and structure revolutions, predicting functionally relevant protein structure changes at scale remains an outstanding challenge. We introduce BioEmu, a deep learning system that emulates protein equilibrium ensembles … >>>

翻译

9.

李翛然 (2025-06-28 14:03):

#paper Boltz-2: Towards Accurate and Efficient Binding Affinity Prediction http://jeremywohlwend.com/assets/boltz2.pdf mit最新发布的一个全原子预测模型。我个人觉得效果并没有显著超越af3 和protenix 但是新闻吹的很多。大家可以用一用，测试一下

bioRxiv, 2025-6-18. DOI: 10.1101/2025.06.14.659707

Boltz-2: Towards Accurate and Efficient Binding Affinity Prediction

翻译

Abstract:

AbstractAccurately modeling biomolecular interactions is a central challenge in modern biology. While recent advances, such as AlphaFold3 and Boltz-1, have substantially improved our ability to predict biomolecular complex structures, these … >>>

翻译

10.

李翛然 (2025-05-30 21:13):

#paper NMRExtractor: leveraging large language models to construct an experimental NMR database from open-source scienti c publications† DOI: 10.1039/D4SC08802F 中国科学院上海药物研究所郑明月团队开发了NMRExtractor工具，基于微调的大型语言模型（Mistral-7b）从570万篇PubMed开源文献中自动提取实验核磁共振（NMR）数据，构建了目前规模最大的公开NMR数据库NMRBank，包含225,809条高质量记录。 1. 高效提取流程 ◦ 通过正则表达式筛选含NMR的段落（380,220条），利用LLM精准提取化合物IUPAC名称、1H/13C NMR化学位移及实验条件。 ◦ 引入置信度评分机制（0-1分），高置信度（>0.8）数据准确率达97%，媲美人工标注水平。最近在看各种仪器数据处理

Chemical Science, 2025. DOI: 10.1039/D4SC08802F

NMRExtractor: leveraging large language models to construct an experimental NMR database from open-source scientific publications

翻译

Qinggong Wang, Wei Zhang, Mingan Chen, Xutong Li, Zhaoping Xiong, Jiacheng Xiong, Zunyun Fu, Mingyue Zheng

Abstract:

NMRExtractor is a large language model-powered pipeline that automatically extracts experimental NMR data from massive open-access publications, resulting in the construction of NMRBank—the largest open-access NMR dataset available to date. >>>

翻译

11.

李翛然 (2025-04-30 10:14):

#paper Computational design of serine hydrolases doi：doi/10.1126/science.adu2454 baker今年的大文章，这周我精读了一下。哈哈接了一个活，和这个非常类似，不过比这个难。需要化学+酶进化+新的工业级纯化方法。非常非常好。 baker我觉得自从或诺奖后，全面开挂，一定要证明AI在设计结构生物学上不可撼动的作用，绝不是，生物或者化学专家说的，我也能干~~~哈哈哈这篇文章写的非常好，逻辑非常舒服

Science, 2025-4-18. DOI: 10.1126/science.adu2454

Computational design of serine hydrolases

翻译

Abstract:

The design of enzymes with complex active sites that mediate multistep reactions remains an outstanding challenge. With serine hydrolases as a model system, we combined the generative capabilities of RFdiffusion … >>>

翻译

12.

李翛然 (2025-03-31 10:04):

#paper doi:doi.org/10.1038/s41467-025-58038-4 Robust enzyme discovery and engineering with deep learning using CataPro. 深度学习赋能酶工程——CataPro模型 1. 研究背景与挑战酶作为高效生物催化剂在工业中应用广泛，但野生酶性能不足且传统改造方法成本高、效率低。现有深度学习模型在酶动力学参数（如kcat、Km）预测中存在数据偏差和泛化能力不足的问题，阻碍了理性设计进程。 2. 模型创新与优势研究团队开发的CataPro模型通过整合预训练语言模型（如ProtT5、MolT5）与分子指纹，显著提升了酶动力学参数的预测精度。其核心突破在于采用无偏十折交叉验证数据集（按序列相似性聚类划分），避免模型对训练数据的“记忆性”过拟合，泛化能力优于现有工具。 3. 实际应用验证在香兰素生物合成案例中，CataPro成功挖掘出活性提升的SsCSO酶，并通过预测指导突变设计获得活性提高3.34倍的突变体。这一成果展示了模型在酶定向进化与工业酶库筛选中的实用性，为生物制造提供高效工具。 4. 局限与未来方向当前模型对复杂催化机制的表征仍有不足，且kcat预测精度受限于数据覆盖度。未来需融合更多物理化学机制特征，并拓展反应类型数据以增强普适性。 5. 总结评价 CataPro通过深度学习与无偏数据策略的结合，为酶工程提供了高可信度预测工具，推动生物催化从经验驱动向数据驱动转型。其成功案例为绿色化工、合成生物学等领域的高效酶设计开辟了新路径，标志着AI在生物制造中的深度渗透。

Nature Communications, 2025-3-20. DOI: 10.1038/s41467-025-58038-4

Robust enzyme discovery and engineering with deep learning using CataPro

翻译

Zechen Wang, Dongqi Xie, Dong Wu, Xiaozhou Luo, Sheng Wang, Yangyang Li, Yanmei Yang, Weifeng Li, Liangzhen Zheng

Abstract:

Abstract Accurate prediction of enzyme kinetic parameters is crucial for enzyme exploration and modification. Existing models face the problem of either low accuracy or poor generalization ability due to overfitting. … >>>

翻译

13.

李翛然 (2025-02-27 12:03):

#paper Biggest-ever AI biology model writes DNA on demand doi:https://doi.org/10.1038/d41586-025-00531-3 evo2 最近非常出名，主要就是微软的ev2该研究可能开发了当前规模最大的基因组语言模型（Genomic Language Model, GLM），通过深度学习技术实现按需设计功能性DNA序列。其核心思路借鉴了大型语言模型（如ChatGPT）的自监督预训练方法，利用海量基因组数据学习DNA序列的“语法规则”，从而预测或生成具有特定调控功能的序列。虽然文章中揭示了bcra基因的突变相关影响基因。但是临床实践上，其实方法很多，暂时没有看出来哪些碾压的存在，倒是twitter讨论的很多，说是可以预测病毒突变，这个我有待观察。论文原文并没有提到这个

Nature, 2025-2-27. DOI: 10.1038/d41586-025-00531-3

Biggest-ever AI biology model writes DNA on demand

翻译

Ewen Callaway

Abstract: No abstract available.

14.

李翛然 (2025-01-27 09:46):

#paper https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf 最近最火的r1论文，好处就不说了，我说几个问题吧。 1 编程。编程最大的问题是过渡理解？就是简单的问题复杂化，无法精确快速匹配我需要的答案，这可能是深度思考造成的问题 2 过拟合。过拟合比较明显，就是个热门的学科和资料回答的很棒。冷门学科的横向联想能力有待提高。整体来说未来可期！

GitHub, 2025-01-23.

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

翻译

DeepSeek-AI

Abstract: No abstract available.

15.

李翛然 (2024-12-27 13:05):

#paper DOI: 10.1093/database/baaa102 NPBS database: a chemical data resource with relational data between natural products and biological sources. Database 2020, baaa102. 一个天然产物数据库，最近我在研究天然产物的一些方案，发现上海药物所把世界上主要的天然产物搞了个数据集，这个还是不错的。给大家也推荐一下，但是搜索还是没做好，还是字符串相似度搜索，拉丁翻译和中文对应的比较差劲。应该上Vector search了。

Database, 2020-12-11. DOI: 10.1093/database/baaa102

NPBS database: a chemical data resource with relational data between natural products and biological sources

翻译

Tingjun Xu, Weiming Chen, Junhong Zhou, Jingfang Dai, Yingyong Li, Yingli Zhao

Abstract:

Abstract NPBS (Natural Products & Biological Sources) database is a chemical data resource with relational data between natural products and biological sources, manually curated from literatures of natural product researches. … >>>

翻译

16.

李翛然 (2024-11-28 11:23):

#paper Extraction of bioactive compounds from plant materials using combination of various novel methods: A review doi:https://doi.org/10.1016/j.tifs.2021.11.019 这文章不错，比较好的整理了植物提取物的方法，很适合化妆品市场。提取技术：提取技术的选择对提取效率至关重要，影响因素包括提取技术、植物成分矩阵属性、提取溶剂、温度、压力和时间。传统提取技术（如索氏提取、浸泡、水蒸气蒸馏等）与新颖技术（如超声辅助提取、脉冲电场辅助提取、超临界流体提取等）的比较。新颖提取技术：新颖技术因其环境友好性、操作时间短、提取效率高和质量改善而受到关注。超声波辅助提取（UAE）、脉冲电场提取（PEF）、酶辅助提取（EAE）、微波辅助提取（MAE）、超临界流体提取（SFE）等技术的应用和优势。组合提取技术：结合使用不同的提取技术可以提高提取效率和选择性，例如超声-微波辅助提取（UMAE）、酶-超声-微波辅助提取（EUMAE）等。这些组合技术可以更有效地从植物材料中提取生物活性化合物。结论：新颖提取技术能够在更短的时间内获得更大的提取产量、更好的产品质量，并减少环境问题。越来越多的研究关注这些创新提取方法的组合使用，这些方法具有快速、方便和安全的优势。文章强调了在提取植物材料中的生物活性化合物时，选择合适提取技术的重要性，并比较了不同方法的优缺点。同时，文章也指出了这些新颖提取技术在实际应用中仍需进一步开发和优化。

Trends in Food Science & Technology, 2022-1. DOI: 10.1016/j.tifs.2021.11.019

Extraction of bioactive compounds from plant materials using combination of various novel methods: A review

翻译

Avinash Kumar Jha, Nandan Sit

Abstract: No abstract available.

17.

李翛然 (2024-10-28 13:54):

#paper Modeling protein-small molecule conformational ensembles with ChemNet doi:10.1101/2024.09.25.614868 baker 又一力作，直接把我们最近正在想的共形几何问题引入蛋白质结构与小分子互作，已经直接实现出来了，下一步其实就是把这个和Diffusion结合，那么小分子de-novo设计就可以完全自动化了。 baker帮我完成了50%的工作~~~

bioRxiv, 2024-9-25. DOI: 10.1101/2024.09.25.614868

Modeling protein-small molecule conformational ensembles with ChemNet

翻译

Abstract:

AbstractModeling the conformational heterogeneity of protein-small molecule systems is an outstanding challenge. We reasoned that while residue level descriptions of biomolecules are efficient for de novo structure prediction, for probing … >>>

翻译

18.

李翛然 (2024-09-27 21:35):

#paper doi:10.13345/j.cjb.220582 《工程菌种自动化高通量编辑与筛选研究进展》该论文主要讨论了合成生物学领域中工程菌种的自动化高通量编辑与筛选技术的研究进展。合成生物学通过标准化和模块化生物实验对象、方法、技术和流程，创建自动化与高通量的合成生物铸造模式。这种模式结合了复杂生物过程与自动化设施，颠覆了传统的劳动密集型研究方式，提高了技术迭代能力，促进了合成生物学的发展和产业化应用。研究进展：自动化基因编辑：论文回顾了天津工业生物技术研究所在自动化高通量编辑与筛选领域的工作进展。讨论了基因克隆、基因组编辑、编辑序列设计的自动化实现。介绍了CRISPR/Cas9系统等基因编辑技术在自动化操作中的应用。高通量筛选技术：论文分析了流式细胞、液滴微流控、全基因组规模扰动测序等高通量筛选技术。讨论了这些技术在筛选工程菌株中的应用和效果。最近在读博，高级制药工程需要读中文论文…………

生物工程学报, 2022.

工程菌种自动化高通量编辑与筛选研究进展

翻译

Abstract: No abstract available.

19.

李翛然 (2024-08-31 14:38):

#paper Development of Free Energy calculation methods for the study of monosaccharidesconformation in computer simulations Doi:10.3389/fmolb.2021.712085 六元环状单糖的褶皱构象开发新的计算工具来研究和描述在分子动力学模拟里碳水化合物的构象特性。最重要的问题是力场选择问题，目前力场参数（GROMOS 45a4参数集），不能复现糖成分的偏好构象对葡萄糖构象的研究存在的困难：无论从实验上（第二流行的构象极其少见的出现）和理论计算模拟上（构象由少数结构主导，导致非遍历性的性能瓶颈因此加速采样方法比如 metadynamics其中集体变量（CV）和对应坐标系的选择很重要，要考虑到分子环的非平面和褶皱构象 1. 采用了新的坐标系Cremer-Pole（θ,φ） 2. 采用了新的坐标系Strauss-Pickett（α1,α2,α3） 3. 采用了笛卡尔压缩的Cremer-Pole（qx,qy）

Frontiers in molecular biosciences, 2021. DOI: 10.3389/fmolb.2021.712085 PMID: 34458321 PMCID:PMC8387144

Recent Developments in Free Energy Calculations for Drug Discovery

翻译

Edward King, Erick Aitchison, Han Li, Ray Luo

Abstract:

The grand challenge in structure-based drug design is achieving accurate prediction of binding free energies. Molecular dynamics (MD) simulations enable modeling of conformational changes critical to the binding process, leading … >>>

翻译

20.

李翛然 (2024-07-30 20:10):

#paper DOI:10.1101/2023.08.08.552403 Identifying small-molecules binding sites in RNA conformational ensembles with SHAMAN 这篇文章怎么说呢，一看就是搞计算机人写的。我来说说为啥。介绍了一种名为SHAMAN的计算技术,可以识别RNA结构集合中的潜在小分子结合位点。与依赖静态结构的其他计算工具不同,SHAMAN旨在解决RNA分子动态性带来的挑战。该技术通过分析RNA结构的构象集合,而不仅仅是单一静态结构,来识别潜在的结合位点。这种方法对于理解小分子与RNA柔性和动态性之间的相互作用特别有用。这里面的关键点，是RNA的构象如何确定的，但是他是使用这个方法确定rna构象的： 1.使用分子动力学(MD)模拟来生成RNA的构象集合。论文中提到使用了Amber力场和TIP3P水模型进行了100 ns的MD模拟。 2.从MD轨迹中提取出具有代表性的RNA构象集合。作者使用了聚类算法来对MD轨迹进行聚类,选择了聚类中心作为代表性构象。 3. 这些代表性构象进行分析,识别小分子可能结合的位点。SHAMAN工具就是用来分析这些构象集合,预测小分子的可能结合位点。这就很扯了，用聚类的方法来选取最有可能的rna 结构，这不扯呢么！邮箱TIP3P水模型就已经是生物容忍的最低限度了，居然在这个状态下模拟rna，然后用数学聚类的方法来选取构想。有点扯！缺乏实验室人员的嘲讽~~~哈哈

bioRxiv, 2024-2-28. DOI: 10.1101/2023.08.08.552403

Identifying small-molecules binding sites in RNA conformational ensembles with SHAMAN

翻译

F. P. Panei, P. Gkeka, M. Bonomi

Abstract:

AbstractThe rational targeting of RNA with small molecules is hampered by our still limited understanding of RNA structural and dynamic properties. Mostin silicotools for binding site identification rely on static … >>>

翻译