C2S Scale Pythia 1b Pt
C
C2S Scale Pythia 1b Pt
vandijklabによって開発
Pythia-1bアーキテクチャに基づいて事前学習されたモデルで、Cell2Sentenceフレームワークを用いて単細胞RNAシーケンスデータで微調整されており、様々な単細胞および多細胞解析タスクに適しています。
ダウンロード数 156
リリース時間 : 4/16/2025
モデル概要
このモデルはCell2Sentenceメソッドを使用してscRNA-seqデータを遺伝子名の順序付き配列に変換し、大規模言語モデルを単細胞生物学研究に適応させ、幅広い単細胞および多細胞タスクを実行できます。
モデル特徴
Cell2Sentenceフレームワーク
scRNA-seqデータを発現レベルに基づいた遺伝子名の順序付き配列に変換し、LLMsを単細胞生物学研究に適応させます。
大規模トレーニングデータ
トレーニングデータは800以上の単細胞RNAシーケンスデータセットをカバーし、5700万以上のヒトおよびマウス細胞を含みます。
マルチタスク能力
単細胞および多細胞解析、遺伝子セット解析など、様々なタスクを実行できます。
拡張されたコンテキスト長
回転位置埋め込み技術により、デフォルトのPythiaモデルのコンテキスト長を8192トークンに拡張しました。
モデル能力
無条件単細胞生成
細胞タイプ予測
細胞タイプ条件付き生成
無条件多細胞生成
組織起源予測
組織条件付き多細胞生成
細胞タイプ条件付き多細胞生成
多細胞から要約生成
要約から多細胞生成
遺伝子セット名から遺伝子生成
遺伝子から遺伝子セット名生成
使用事例
生物医学研究
単細胞RNAシーケンスデータ解析
単細胞RNAシーケンスデータを解析し、細胞タイプや状態を予測します。
細胞生成
特定の条件に基づいて模擬的な単細胞または多細胞データを生成します。
遺伝子セット解析
遺伝子セット名に基づいて遺伝子リストを生成する、またはその逆を行います。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98