M

Materials.smi Ted

ibm-researchによって開発
IBMが提案した化学言語基盤モデルで、分子表現変換や量子特性予測など多様なタスクをサポート
ダウンロード数 20.65k
リリース時間 : 7/25/2024

モデル概要

SMI-TEDはSMILESベースの大規模化学基盤エンコーダ・デコーダモデルで、9100万分子サンプルで事前学習され、分子表現変換や量子特性予測などの複雑なタスクをサポート

モデル特徴

マルチモーダル分子表現
SMILES文字列、SELFIESエンコーディング、3D原子座標など多様な分子表現形式をサポート
大規模事前学習
PubChemの9100万分子サンプル(40億トークン)で事前学習
デュアルトレーニング戦略
マスク言語モデルとエンコーダ・デコーダ戦略を組み合わせてモデル性能を最適化

モデル能力

分子表現変換
量子特性予測
SMILESエンコーディング・デコーディング
分子特徴抽出

使用事例

材料発見
新規分子設計
分子表現学習を通じて潜在的な新規化合物を生成
創薬研究
分子特性予測
候補薬物の量子化学的特性を予測
MoleculeNetベンチマークテストで優れた性能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase