M

Molformer XL Both 10pct

ibm-researchによって開発
MoLFormerはZINCとPubChemの11億分子SMILES文字列で事前学習された化学言語モデルで、このバージョンは両データセットの10%サンプルで学習
ダウンロード数 171.96k
リリース時間 : 10/20/2023

モデル概要

線形アテンションTransformerアーキテクチャを採用した化学言語モデルで、主に分子特徴抽出と特性予測タスクに使用

モデル特徴

効率的なアテンション機構
線形アテンションTransformerアーキテクチャを採用し、計算複雑性を大幅に低減
二重データセット事前学習
ZINC15とPubChemデータセットを同時に使用して学習し、より広範な化学空間をカバー
分子特性学習
自己教師あり学習により分子構造と性質の関係を捕捉

モデル能力

分子特徴抽出
分子特性予測
分子類似性計算

使用事例

創薬
溶解度予測
化合物の水溶性を予測
ESOLデータセットでRMSE 0.3295
毒性予測
化合物の毒性を評価
Tox21データセットでAUROC 84.5
材料科学
量子化学特性予測
分子の量子力学的特性を予測
QM9データセットでMAE 1.7754
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase