李翛然
(2022-02-27 09:48):
#paper doi 10.1002 : Image2SMILES: Transformer-Based Molecular Optical Recognition Engine (2022) https://doi.org/10.1002/cmtd.202100069 这篇文章主要讲述了如何利用transformer 模型将文献中的化学分子式识别并转换为可以进一步分析用的smiles结构。这项技术算是一个比较“有则更好,无则也能抗的过去”的模型,因为需要进行smiles识别的分子,其肯定基本上都会被关注到论文和结构价值。但是,关注到之后,相关有经验的化学专家看一眼图像就知道里面的问题,和结构细节。 那至于如何找到有价值的化学结构,其实又是NLP读取论文的事情了。所以这个技术我觉得有点鸡肋,北京的望石科技就是干这个的。
Chemistry - Methods,
2022.
DOI: 10.1002/cmtd.202100069
Image2SMILES: Transformer-Based Molecular Optical Recognition Engine
翻译
Abstract:
No abstract available.