V

Vietnamese Document Embedding

dangvantuanによって開発
ベトナム語用のドキュメント埋め込みモデルで、最大8096トークンのコンテキストをサポートし、gte - multilingualをベースに訓練されています。
ダウンロード数 77.61k
リリース時間 : 8/15/2024

モデル概要

これはベトナム語用に特別に訓練された長テキスト埋め込みモデルで、正確でコンテキストに関連した文の埋め込みを生成でき、ベトナム語テキストの意味的類似度計算やドキュメント検索などのタスクに適しています。

モデル特徴

長テキストサポート
最大8096トークンのコンテキストをサポートし、ベトナム語の長いドキュメントの処理に適しています。
多段階訓練
XNLI自然言語推論とSTS意味的類似性の2段階の訓練を経て、モデルの性能を向上させます。
高度な損失関数
多負例順序付け損失、Matryoshka2dLoss、類似度損失を用いて訓練されています。

モデル能力

ベトナム語テキスト埋め込み
文の類似度計算
ドキュメント検索
意味的特徴抽出

使用事例

テキスト検索
ベトナム語ドキュメント検索
このモデルを使用してベトナム語ドキュメントの埋め込みを生成し、効率的なドキュメント検索システムを実現します。
意味分析
ベトナム語文の類似度計算
ベトナム語の文間の意味的類似度を計算し、質問応答システムやチャットボットに使用します。
STS Benchmarkで平均82.45のスピアマン相関係数を達成しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase