S

Swin Distilbertimbau

laicsiifesによって開発
Swin TransformerとDistilBERTimbauに基づくブラジルポルトガル語画像説明生成モデル
ダウンロード数 18
リリース時間 : 9/1/2024

モデル概要

このモデルは視覚エンコーダ-デコーダモデルで、ブラジルポルトガル語の画像説明生成に特化しています。視覚エンコーダとしてSwin Transformerを、テキストデコーダとしてDistilBERTimbauを組み合わせています。

モデル特徴

効率的なデュアルモデルアーキテクチャ
Swin Transformerの視覚エンコード能力とDistilBERTimbauのテキスト生成能力を組み合わせた
ポルトガル語サポート
ブラジルポルトガル語に最適化された画像説明生成
高性能
Flickr30Kポルトガル語データセットで優れた性能を発揮し、複数の指標でリードしている

モデル能力

画像理解
ポルトガル語テキスト生成
画像からテキストへの変換

使用事例

コンテンツ生成
ソーシャルメディア画像説明
ソーシャルメディアプラットフォーム上の画像に自動的にポルトガル語の説明を生成
自然で流暢なポルトガル語画像説明を生成
支援技術
視覚障害者向けに画像の文字説明を提供
視覚障害ユーザーが画像内容を理解するのを支援
多言語アプリケーション
ポルトガル語コンテンツ作成
ポルトガル語市場向けに画像関連コンテンツを自動生成
ポルトガル語コンテンツ作成の効率を向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase