A

Araeurobert 210M

Omartificial-Intelligence-Spaceによって開発
EuroBERT-210mをファインチューニングしたアラビア語意味埋め込みモデルで、マトリョーシカ埋め込み技術をサポート
ダウンロード数 304
リリース時間 : 3/11/2025

モデル概要

アラビア語テキストに最適化された文変換モデルで、文を768次元ベクトル空間にマッピング可能。様々な埋め込み次元をサポートし、異なる効率要件に対応

モデル特徴

マトリョーシカ埋め込み技術
埋め込み次元(768/512/256/128/64)を柔軟に調整可能で、再トレーニング不要で性能と効率のバランスを取れる
長文サポート
最大シーケンス長8,192トークンで、長文書処理に適している
アラビア語最適化
アラビア語特性に特化して最適化されており、ベースモデルに比べSTSタスクで大幅な向上
マルチ損失関数トレーニング
MatryoshkaLossとMultipleNegativesRankingLossを組み合わせてトレーニング

モデル能力

意味的テキスト類似度計算
意味検索
情報検索
文書クラスタリング
質問応答システム
言い換え検出
ゼロショット分類

使用事例

情報検索
アラビア語検索エンジン
アラビア語コンテンツの意味検索エンジン構築に使用
検索結果の関連性と精度を向上
テキスト分析
文書類似度分析
アラビア語文書間の意味的類似度を分析
STS17タスクで73.5%の相対的向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase