C

C2S Pythia 410m Cell Type Prediction

由vandijklab開發
基於Pythia-410m架構的細胞類型預測模型,通過Cell2Sentence方法將scRNA-seq數據轉化為'細胞句子'進行微調,專注於單細胞RNA測序數據的細胞類型預測。
下載量 266
發布時間 : 9/3/2024

模型概述

該模型利用大型語言模型處理自然語言的能力,通過創新的Cell2Sentence方法將單細胞RNA測序數據轉換為基因名稱序列,從而實現細胞類型的預測。

模型特點

Cell2Sentence創新方法
將scRNA-seq數據轉化為按表達水平排序的基因名稱序列('細胞句子'),使LLMs能夠適應單細胞生物學研究。
大規模訓練數據
基於800多個單細胞RNA測序數據集中的超過5700萬個人類和鼠類細胞進行訓練,涵蓋多種組織和細胞類型。
跨物種適用性
訓練數據包含人類和鼠類細胞,模型可能具備跨物種細胞類型預測能力。

模型能力

單細胞RNA測序數據分析
細胞類型預測
基因表達模式識別

使用案例

生物醫學研究
細胞圖譜構建
幫助研究人員快速分類和註釋大規模單細胞測序數據中的細胞類型
加速人類細胞圖譜等項目的細胞註釋過程
疾病研究
識別疾病樣本中的異常細胞類型或狀態
可能發現新的疾病相關細胞亞群
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase