C

C2S Scale Pythia 1b Pt

由vandijklab開發
基於Pythia-1b架構預訓練的模型,通過Cell2Sentence框架在單細胞RNA測序數據上微調,適用於多種單細胞及多細胞分析任務。
下載量 156
發布時間 : 4/16/2025

模型概述

該模型採用Cell2Sentence方法將scRNA-seq數據轉化為基因名稱有序序列,使大型語言模型適應單細胞生物學研究,能執行廣泛的單細胞和多細胞任務。

模型特點

Cell2Sentence框架
將scRNA-seq數據轉化為基於表達水平的基因名稱有序序列,使LLMs適應單細胞生物學研究。
大規模訓練數據
訓練數據涵蓋800多個單細胞RNA測序數據集,超過5700萬個人類和小鼠細胞。
多任務能力
能夠執行單細胞和多細胞分析、基因集分析等多種任務。
擴展上下文長度
通過旋轉位置嵌入技術擴展了默認Pythia模型的上下文長度至8192個標記。

模型能力

無條件單細胞生成
細胞類型預測
細胞類型條件生成
無條件多細胞生成
組織來源預測
組織條件多細胞生成
細胞類型條件多細胞生成
多細胞到摘要生成
摘要到多細胞生成
基因集名稱到基因生成
基因到基因集名稱生成

使用案例

生物醫學研究
單細胞RNA測序數據分析
分析單細胞RNA測序數據,預測細胞類型或狀態。
細胞生成
根據特定條件生成模擬的單細胞或多細胞數據。
基因集分析
根據基因集名稱生成基因列表或反之。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase