B

Bytedance Research.ui TARS 72B SFT GGUF

由DevQuasar開發
字節跳動研究團隊發佈的72B參數規模的多模態基礎模型,專注於圖像文本轉文本任務
下載量 81
發布時間 : 3/6/2025

模型概述

該模型是一個經過監督微調的大規模多模態模型,能夠處理圖像與文本之間的轉換任務,具有強大的跨模態理解能力

模型特點

大規模參數
72B參數規模提供強大的模型容量和表現力
多模態能力
能夠同時處理視覺和文本信息,實現跨模態理解
監督微調
經過專門的監督微調(SFT),優化特定任務表現

模型能力

圖像理解
文本生成
跨模態轉換
視覺問答

使用案例

內容生成
圖像描述生成
根據輸入圖像生成詳細的文字描述
可生成準確、豐富的圖像描述
輔助工具
視覺輔助
為視覺障礙用戶提供圖像內容描述
提高無障礙訪問能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase