V

Vietnamese Embedding

AITeamVNによって開発
BGE-M3をファインチューニングしたベトナム語埋め込みモデル、ベトナム語検索能力を強化
ダウンロード数 14.26k
リリース時間 : 3/17/2025

モデル概要

Vietnamese_EmbeddingはBGE-M3モデルをファインチューニングした埋め込みモデルで、ベトナム語検索タスクに特化して最適化されており、約30万組のベトナム語クエリ、ポジティブドキュメント、ネガティブドキュメントのトリプルでトレーニングされています。

モデル特徴

ベトナム語最適化
ベトナム語検索タスクに特化してファインチューニングされ、ベトナム語テキストの埋め込み品質を向上
長文サポート
最大2048トークンのシーケンス長をサポート、長文書処理に適している
高性能
法律文書検索タスクにおいてベースモデルBGE-M3や他のベトナム語埋め込みモデルよりも優れた性能

モデル能力

ベトナム語テキスト埋め込み
文類似度計算
文書検索

使用事例

情報検索
法律文書検索
法律テキストデータセットで高精度な文書検索を実現
Legal Zalo 2021データセットでAccuracy@1が0.7274を達成
汎用文書検索
様々なベトナム語文書の検索タスクに適用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase