🚀 Helix-mRNA-v0
Helix-mRNAは、ハイブリッドな状態空間とトランスフォーマーに基づくモデルです。Mamba2の状態空間アーキテクチャの効率的なシーケンス処理能力と、トランスフォーマーのアテンションメカニズムの文脈理解能力の両方を活用し、これら2つのアプローチの長所を兼ね備えています。これらの特性により、全長転写産物、スプライスバリアント、および複雑なmRNA構造要素の研究に特に適しています。
私たちは、各ヌクレオチド(A、C、U、G)と曖昧な塩基(N)を一意の整数にマッピングすることで、mRNA配列を単一ヌクレオチド分解能でトークン化します。さらに、各コドンの開始を示す特殊文字Eが配列に組み込まれています。この細粒度のアプローチは、モデルが配列からパターンを抽出する能力を最大化します。ヌクレオチドをグループ化したり、k-merベースのアプローチを使用したりする粗いトークン化方法とは異なり、私たちの単一ヌクレオチド分解能は、mRNA分子の完全な配列情報を保持します。このシンプルで効果的なエンコーディング方式により、前処理段階で情報が失われることがなく、下流のモデルが生の配列構成から直接学習できるようになります。
Helix-mRNAのTransformer HELM、Transformer XE、およびCodonBERTとのベンチマーク比較。
詳細は、私たちの 論文 をご覧ください!
🚀 クイックスタート
Helicalのインストールと使用
📦 インストール
以下のコマンドを実行して、Helical パッケージをpipを介してインストールします。
pip install --upgrade helical
💻 使用例
基本的な使用法
from helical.models.helix_mrna import HelixmRNA, HelixmRNAConfig
import torch
device = "cuda" if torch.cuda.is_available() else "cpu"
input_sequences = ["EACU"*20, "EAUG"*20, "EAUG"*20, "EACU"*20, "EAUU"*20]
helix_mrna_config = HelixmRNAConfig(batch_size=5, device=device, max_length=100)
helix_mrna = HelixmRNA(configurer=helix_mrna_config)
processed_input_data = helix_mrna.process_data(input_sequences)
embeddings = helix_mrna.get_embeddings(processed_input_data)
高度な使用法
from helical.models.helix_mrna import HelixmRNA, HelixmRNAConfig
import torch
device = "cuda" if torch.cuda.is_available() else "cpu"
input_sequences = ["EACU"*20, "EAUG"*20, "EAUG"*20, "EACU"*20, "EAUU"*20]
labels = [0, 2, 2, 0, 1]
helixr_config = HelixmRNAConfig(batch_size=5, device=device, max_length=100)
helixr_fine_tune = HelixmRNAFineTuningModel(helix_mrna_config=helixr_config, fine_tuning_head="classification", output_size=3)
train_dataset = helixr_fine_tune.process_data(input_sequences)
helixr_fine_tune.train(train_dataset=train_dataset, train_labels=labels)
outputs = helixr_fine_tune.get_outputs(train_dataset)
📚 詳細ドキュメント
論文とパッケージの引用
@misc{wood2025helixmrnahybridfoundationmodel,
title={Helix-mRNA: A Hybrid Foundation Model For Full Sequence mRNA Therapeutics},
author={Matthew Wood and Mathieu Klop and Maxime Allard},
year={2025},
eprint={2502.13785},
archivePrefix={arXiv},
primaryClass={q-bio.GN},
url={https://arxiv.org/abs/2502.13785},
}
@software{allard_2024_13135902,
author = {Helical Team},
title = {helicalAI/helical: v0.0.1-alpha10},
month = nov,
year = 2024,
publisher = {Zenodo},
version = {0.0.1a10},
doi = {10.5281/zenodo.13135902},
url = {https://doi.org/10.5281/zenodo.13135902}
}
📄 ライセンス
このライブラリは cc-by-nc-sa-4.0
ライセンスの下で提供されています。
📋 情報一覧
属性 |
详情 |
ライブラリ名 |
transformers |
パイプラインタグ |
特徴抽出 |
タグ |
Helical、RNA、Transformers、Sequence、biology、mrna、rna、genomics |
ライセンス |
cc-by-nc-sa-4.0 |