D

Dek21 Hcmute Embedding

huyydanggによって開発
RAGと生産性に特化したベトナム語テキスト埋め込みモデル、10万件の法律問題データセットで訓練
ダウンロード数 696
リリース時間 : 1/25/2025

モデル概要

このモデルはベトナム語の文変換モデルで、法律文書の類似度計算と情報検索に特化しており、効率向上のためにマトリョーシカ損失で訓練されています。

モデル特徴

マトリョーシカ損失訓練
埋め込みベクトルを最小限の性能損失で切り詰めることが可能で、より小さな埋め込みベクトルを迅速に比較でき、生産性を向上させます
法律分野最適化
約10万件の法律問題とその関連コンテキストの内部データセットで訓練されており、法律文書処理に特に適しています
効率的なベクトル比較
複数の次元(768/512/256/128/64)の埋め込みベクトルをサポートし、性能要件に応じて柔軟に選択できます

モデル能力

法律文書類似度計算
法律情報検索
法律条項マッチング
ベトナム語テキスト特徴抽出

使用事例

法律情報検索
法律条項マッチング
ユーザークエリと関連法律条項をマッチング
テストデータセットで0.5856のコサイン精度@1を達成
法律QAシステム
法律知識ベースの質問応答システムを構築
VMTEB-Zalo-legel-retrieval-wsegデータセットでndcg@3が0.9084を達成
法律文書処理
法律文書分類
法律文書を自動分類
法律文書クラスタリング
類似法律文書を自動的にクラスタリング
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase