V

Veld Base

由KETI-AIR開發
支持韓語和英語的預訓練視覺編碼器文本解碼器模型
下載量 40
發布時間 : 11/2/2022

模型概述

VELD是一個多語言視覺與語言預訓練模型,專注於圖像到文本的轉換任務,支持韓語和英語處理。

模型特點

多語言支持
專門支持韓語和英語的視覺語言處理
預訓練模型
基於大規模數據預訓練,可直接用於下游任務
視覺語言理解
能夠理解圖像內容並生成相關文本描述

模型能力

圖像理解
多語言文本生成
視覺語言表示學習

使用案例

內容生成
圖像描述生成
為圖像自動生成韓語或英語描述
多模態應用
視覺問答
基於圖像內容回答相關問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase