T

Taivisionlm Base V2

由benchang1110開發
首個支持繁體中文指令輸入的視覺語言模型(12億參數),兼容Transformers庫,加載迅速、微調便捷
下載量 122
發布時間 : 9/17/2024

模型概述

多模態大語言模型,結合SigLIP視覺編碼器與Tinyllama語言模型,通過視覺投影器連接雙模態,專為繁體中文視覺語言任務設計

模型特點

繁體中文支持
首個專門支持繁體中文指令輸入的視覺語言模型
高效架構
僅12億參數的輕量級設計,保持高性能的同時降低計算需求
Transformers兼容
完全兼容Hugging Face Transformers庫,無需額外依賴
多階段訓練
採用單模態預訓練、特徵對齊和任務專項訓練的三階段開發流程

模型能力

圖像描述生成
視覺問答
多模態理解
繁體中文文本生成

使用案例

內容理解
圖像描述
為圖像生成詳細的繁體中文描述
v2版本能提供比v1更詳細的視覺元素分析
視覺問答
回答關於圖像內容的繁體中文問題
教育應用
輔助學習
幫助繁體中文用戶理解視覺內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase