C2S Scale Pythia 1b Pt
C
C2S Scale Pythia 1b Pt
由vandijklab開發
基於Pythia-1b架構預訓練的模型,通過Cell2Sentence框架在單細胞RNA測序數據上微調,適用於多種單細胞及多細胞分析任務。
下載量 156
發布時間 : 4/16/2025
模型概述
該模型採用Cell2Sentence方法將scRNA-seq數據轉化為基因名稱有序序列,使大型語言模型適應單細胞生物學研究,能執行廣泛的單細胞和多細胞任務。
模型特點
Cell2Sentence框架
將scRNA-seq數據轉化為基於表達水平的基因名稱有序序列,使LLMs適應單細胞生物學研究。
大規模訓練數據
訓練數據涵蓋800多個單細胞RNA測序數據集,超過5700萬個人類和小鼠細胞。
多任務能力
能夠執行單細胞和多細胞分析、基因集分析等多種任務。
擴展上下文長度
通過旋轉位置嵌入技術擴展了默認Pythia模型的上下文長度至8192個標記。
模型能力
無條件單細胞生成
細胞類型預測
細胞類型條件生成
無條件多細胞生成
組織來源預測
組織條件多細胞生成
細胞類型條件多細胞生成
多細胞到摘要生成
摘要到多細胞生成
基因集名稱到基因生成
基因到基因集名稱生成
使用案例
生物醫學研究
單細胞RNA測序數據分析
分析單細胞RNA測序數據,預測細胞類型或狀態。
細胞生成
根據特定條件生成模擬的單細胞或多細胞數據。
基因集分析
根據基因集名稱生成基因列表或反之。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98