M

Molformer XL Both 10pct

由ibm-research開發
MoLFormer是基於ZINC和PubChem中11億分子SMILES字符串預訓練的化學語言模型,本版本使用兩個數據集各10%樣本訓練
下載量 171.96k
發布時間 : 10/20/2023

模型概述

採用線性注意力Transformer架構的化學語言模型,主要用於分子特徵提取和屬性預測任務

模型特點

高效注意力機制
採用線性注意力Transformer架構,顯著降低計算複雜度
雙數據集預訓練
同時使用ZINC15和PubChem數據集進行訓練,覆蓋更廣的化學空間
分子表徵學習
通過自監督學習捕獲分子結構與性質的關係

模型能力

分子特徵提取
分子屬性預測
分子相似性計算

使用案例

藥物發現
溶解度預測
預測化合物的水溶性
在ESOL數據集上RMSE為0.3295
毒性預測
評估化合物毒性
在Tox21數據集上AUROC達84.5
材料科學
量子化學性質預測
預測分子的量子力學性質
在QM9數據集上MAE為1.7754
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase