C

C2S Pythia 410m Diverse Single And Multi Cell Tasks

由vandijklab開發
基於Pythia-410m架構的模型,通過Cell2Sentence方法在單細胞RNA測序數據上微調,適用於多種單細胞和多細胞分析任務。
下載量 238
發布時間 : 9/3/2024

模型概述

該模型利用Cell2Sentence方法將scRNA-seq數據轉換為基因名稱的有序序列,使大型語言模型適應單細胞生物學研究,能夠執行廣泛的單細胞和多細胞分析任務。

模型特點

Cell2Sentence方法
將scRNA-seq數據轉換為基於表達水平的基因名稱有序序列,使LLMs適應單細胞生物學研究。
廣泛的數據覆蓋
訓練數據涵蓋800多個單細胞RNA測序數據集,總計超過5700萬個人類和鼠類細胞。
多任務能力
能夠執行單細胞和多細胞分析、細胞類型預測、組織預測等多種任務。
可變上下文長度
支持最大8192個標記的上下文長度,適應不同規模的基因序列分析。

模型能力

無條件單細胞生成
細胞類型預測
細胞類型條件生成
無條件多細胞生成
組織預測
細胞類型預測(多細胞)
組織條件多細胞生成
細胞類型條件多細胞生成
多細胞到摘要生成
摘要到多細胞生成
基因集名稱到基因生成
基因到基因集名稱生成

使用案例

單細胞分析
細胞類型識別
根據單細胞RNA測序數據預測細胞類型。
單細胞生成
無條件或基於特定細胞類型生成單細胞數據。
多細胞分析
組織來源預測
預測一組細胞的來源組織。
多細胞生成
基於特定組織或細胞類型生成多細胞數據。
基因集分析
基因集名稱生成
根據基因列表生成基因集名稱。
基因列表生成
根據基因集名稱生成按字母順序排列的基因列表。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase