M-BERT-Distil-40オープンソースモデル - 40種類の言語の埋め込み空間に適合し、CLIPテキストエンコーダーと互換性がある

ホーム

M BERT Distil 40

M-CLIPによって開発

distilbert-base-multilingualをベースにしたモデルで、40言語の埋め込み空間に合わせて調整され、CLIPテキストエンコーダーの埋め込み空間と一致するように設計されています。

テキスト生成画像

Transformers

複数言語対応#多言語テキスト埋め込み #CLIP互換 #40言語サポート

ダウンロード数 46

リリース時間 : 3/2/2022

モデル概要

これは多言語テキストエンコーディングモデルで、CLIPテキストエンコーダーの埋め込み空間に合わせて調整され、40言語をサポートします。

モデル特徴

多言語サポート

40言語のテキスト埋め込みをサポートし、幅広い言語範囲をカバーします。

CLIP互換

CLIPテキストエンコーダーの埋め込み空間に合わせて調整されており、CLIP視覚エンコーダーと組み合わせて使用できます。

DistilBERTベース

distilbert-base-multilingual-casedモデルをベースにしており、効率的な性能を発揮します。

モデル能力

多言語テキスト埋め込み

CLIP視覚エンコーダーとの連携

40言語のテキスト処理をサポート

使用事例

多言語アプリケーション

多言語画像キャプション

CLIP視覚エンコーダーと組み合わせて、多言語の画像キャプションを生成します。

フランス語、ドイツ語、スペイン語、ロシア語、スウェーデン語、ギリシャ語などで良好なパフォーマンスを示します。

クロスランゲージ検索

異なる言語間のテキストや画像検索に使用されます。

🚀 M-BERT Distil 40

事前学習された多言語モデルをCLIPの埋め込み空間に合わせて調整した、40言語対応の言語モデルです。

🚀 クイックスタート

このモデルを元のCLIPビジョンエンコーダーとともに使用するには、Multilingual-CLIPのGitHubリポジトリからコードと追加の線形重みをダウンロードする必要があります。

ダウンロードが完了したら、以下のコードでモデルをロードして使用できます。

from src import multilingual_clip

model = multilingual_clip.load_model('M-BERT-Distil-40')
embeddings = model(['Älgen är skogens konung!', 'Wie leben Eisbären in der Antarktis?', 'Вы знали, что все белые медведи левши?'])
print(embeddings.shape)
# Yields: torch.Size([3, 640])