本文介绍: 分子属性预测得到巨大的关注,分子图能够被描述为图结构的数据或SMILES 文本。LLMs的快速发展给NLP领域带来颠覆性变化,但是,LLM如何影响分子性质预测的探索仍处于早期阶段。本文提出,对于所给的SMILES序列,设计合理的提示,提示LLM进行zero/few-shot 分类,并总结出新的表征,用新的表征在下游任务上微调小规模LMs。
0、基本信息
1、研究动机
分子属性预测得到巨大的关注,分子图能够被描述为图结构的数据或SMILES (Simplified Molecular-Input Line-Entry System)文本。LLMs的快速发展给NLP领域带来颠覆性变化,但是,LLM如何影响分子性质预测的探索仍处于早期阶段。
本文,从两个视角——零样本和少样本分子分类,通过LLMs生成分子原始SMILESD的新解释。
2、创新性
由于分子可以表示为SMILES序列,因此使用具有强大文本理解能力的LLM来处理分子数据是一个不错的想法。简而言之,大模型在分子预测任务上的迁移。
例如,对于给定分子的SMILES,ChatGPT可以准确地描述分子的功能组、化学性质和潜在的药物应用。如下图所示。
3、方法论
4、实验结果
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。