C2S Pythia 410m Diverse Single And Multi Cell Tasks
C
C2S Pythia 410m Diverse Single And Multi Cell Tasks
由vandijklab開發
基於Pythia-410m架構的模型,通過Cell2Sentence方法在單細胞RNA測序數據上微調,適用於多種單細胞和多細胞分析任務。
下載量 238
發布時間 : 9/3/2024
模型概述
該模型利用Cell2Sentence方法將scRNA-seq數據轉換為基因名稱的有序序列,使大型語言模型適應單細胞生物學研究,能夠執行廣泛的單細胞和多細胞分析任務。
模型特點
Cell2Sentence方法
將scRNA-seq數據轉換為基於表達水平的基因名稱有序序列,使LLMs適應單細胞生物學研究。
廣泛的數據覆蓋
訓練數據涵蓋800多個單細胞RNA測序數據集,總計超過5700萬個人類和鼠類細胞。
多任務能力
能夠執行單細胞和多細胞分析、細胞類型預測、組織預測等多種任務。
可變上下文長度
支持最大8192個標記的上下文長度,適應不同規模的基因序列分析。
模型能力
無條件單細胞生成
細胞類型預測
細胞類型條件生成
無條件多細胞生成
組織預測
細胞類型預測(多細胞)
組織條件多細胞生成
細胞類型條件多細胞生成
多細胞到摘要生成
摘要到多細胞生成
基因集名稱到基因生成
基因到基因集名稱生成
使用案例
單細胞分析
細胞類型識別
根據單細胞RNA測序數據預測細胞類型。
單細胞生成
無條件或基於特定細胞類型生成單細胞數據。
多細胞分析
組織來源預測
預測一組細胞的來源組織。
多細胞生成
基於特定組織或細胞類型生成多細胞數據。
基因集分析
基因集名稱生成
根據基因列表生成基因集名稱。
基因列表生成
根據基因集名稱生成按字母順序排列的基因列表。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98