C2S Pythia 410m Diverse Single And Multi Cell Tasks
C
C2S Pythia 410m Diverse Single And Multi Cell Tasks
vandijklabによって開発
Pythia-410mアーキテクチャに基づくモデルで、Cell2Sentenceメソッドを用いて単細胞RNAシーケンスデータで微調整され、様々な単細胞および多細胞分析タスクに適しています。
ダウンロード数 238
リリース時間 : 9/3/2024
モデル概要
このモデルはCell2Sentenceメソッドを使用してscRNA-seqデータを遺伝子名の順序付きシーケンスに変換し、大規模言語モデルを単細胞生物学研究に適応させ、幅広い単細胞および多細胞分析タスクを実行できます。
モデル特徴
Cell2Sentenceメソッド
scRNA-seqデータを発現レベルに基づく遺伝子名の順序付きシーケンスに変換し、LLMを単細胞生物学研究に適応させます。
広範なデータカバレッジ
800以上の単細胞RNAシーケンスデータセット、合計5700万以上のヒトおよびマウス細胞を含むトレーニングデータ。
マルチタスク能力
単細胞および多細胞分析、細胞タイプ予測、組織予測など様々なタスクを実行可能。
可変文脈長
最大8192トークンの文脈長をサポートし、様々な規模の遺伝子シーケンス分析に対応。
モデル能力
無条件単細胞生成
細胞タイプ予測
細胞タイプ条件付き生成
無条件多細胞生成
組織予測
細胞タイプ予測(多細胞)
組織条件付き多細胞生成
細胞タイプ条件付き多細胞生成
多細胞から要約生成
要約から多細胞生成
遺伝子セット名から遺伝子生成
遺伝子から遺伝子セット名生成
使用事例
単細胞分析
細胞タイプ識別
単細胞RNAシーケンスデータに基づいて細胞タイプを予測します。
単細胞生成
無条件または特定の細胞タイプに基づいて単細胞データを生成します。
多細胞分析
組織起源予測
細胞群の起源組織を予測します。
多細胞生成
特定の組織または細胞タイプに基づいて多細胞データを生成します。
遺伝子セット分析
遺伝子セット名生成
遺伝子リストに基づいて遺伝子セット名を生成します。
遺伝子リスト生成
遺伝子セット名に基づいてアルファベット順の遺伝子リストを生成します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98