S

Swin Distilbertimbau

由laicsiifes開發
基於Swin Transformer和DistilBERTimbau的巴西葡萄牙語圖像描述生成模型
下載量 18
發布時間 : 9/1/2024

模型概述

該模型是一個視覺編碼器-解碼器模型,專門用於生成巴西葡萄牙語的圖像描述。它結合了Swin Transformer作為視覺編碼器和DistilBERTimbau作為文本解碼器。

模型特點

高效的雙模型架構
結合了Swin Transformer的視覺編碼能力和DistilBERTimbau的文本生成能力
葡萄牙語支持
專門針對巴西葡萄牙語優化的圖像描述生成
高性能
在Flickr30K葡萄牙語數據集上表現出色,多項指標領先

模型能力

圖像理解
葡萄牙語文本生成
圖像到文本轉換

使用案例

內容生成
社交媒體圖像描述
為社交媒體平臺上的圖像自動生成葡萄牙語描述
生成自然流暢的葡萄牙語圖像描述
輔助技術
為視障人士提供圖像的文字描述
幫助視障用戶理解圖像內容
多語言應用
葡萄牙語內容創作
為葡萄牙語市場自動生成圖像相關內容
提高葡萄牙語內容創作效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase