A

Araeurobert 2.1B

Omartificial-Intelligence-Spaceによって開発
EuroBERT-2.1Bをファインチューニングしたアラビア語意味埋め込みモデルで、2304次元の密ベクトル空間と最大8192トークンの入力をサポートします。
ダウンロード数 45
リリース時間 : 3/20/2025

モデル概要

アラビア語に最適化された意味テキスト埋め込みモデルで、意味類似度計算、意味検索、テキスト分類など様々なNLPタスクに適しています。

モデル特徴

高次元意味埋め込み
2304次元の密ベクトル空間をサポートし、豊富な意味情報を捉えることが可能
長文対応
最大8192トークンの入力をサポートし、長文処理に適している
ネスト型次元選択
2304、1152、960、580の4種類の次元選択をサポートし、性能と計算効率のバランスを取る
アラビア語最適化
アラビア語に特化して最適化されており、STS17ベンチマークで79点を獲得

モデル能力

意味テキスト類似度計算
意味検索
言い換えマイニング
テキスト分類
クラスタリング分析

使用事例

情報検索
アラビア語文書類似度検索
アラビア語文書コレクションから意味的に類似した文書を検索
高精度な意味マッチング
コンテンツ分析
アラビア語テキストクラスタリング
アラビア語ニュースやソーシャルメディアコンテンツを主題ごとにクラスタリング
効果的な主題識別とグループ化
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase