A

Amber Large

retrieva-jpによって開発
modernbert-ja-310m をベースとした日英双语句子特徴抽出モデルで、文の類似度計算とテキスト分類タスクをサポート
ダウンロード数 239.28k
リリース時間 : 3/7/2025

モデル概要

このモデルは日英バイリンガルシナリオにおける文の埋め込み表現に特化しており、文の類似度計算、テキスト分類、クラスタリングタスクに使用可能。MTEBベンチマークテストでは分類とクラスタリングタスクで良好なパフォーマンスを示しています。

モデル特徴

日英バイリンガルサポート
日本語と英語のバイリンガルシナリオに最適化されており、両言語の文埋め込み表現を処理可能
マルチタスク適応
分類、クラスタリング、検索など様々な自然言語処理タスクをサポート
MTEB ベンチマーク検証
複数のMTEBベンチマークテストで良好な結果を示し、特に分類タスクでは73.34%の精度を達成

モデル能力

文特徴抽出
文類似度計算
テキスト分類
テキストクラスタリング
クロスランゲージテキスト処理

使用事例

電子商取引
製品レビュー分類
AmazonなどのECプラットフォームのユーザーレビューを分類
Amazonの反事実分類タスクで73.34%の精度を達成
学術研究
論文クラスタリング
arXiv学術論文の階層的クラスタリング
arXiv論文クラスタリングタスクでV-measure53.39を達成
情報検索
議論点検索
ディベートシナリオで関連する議論点を検索
ArguAnaタスクでNDCG@10が51.32を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase