T

Text2vec Base Chinese Paraphrase

shibing624によって開発
CoSENT手法で訓練された中国語テキストベクトル化モデル、文埋め込み、テキストマッチング、意味検索などのタスクをサポート
ダウンロード数 45.88k
リリース時間 : 6/19/2023

モデル概要

このモデルは中国語の文を768次元の密なベクトル空間にマッピングし、文埋め込み、テキストマッチング、意味検索などのタスクに使用可能。nghuyong/ernie-3.0-base-zhモデルを基に、強化版中国語STSデータセットで訓練され、中国語NLIテストセットでSOTAを達成。

モデル特徴

強化版中国語STSデータセット訓練
s2p(文対段落)データを含む強化版中国語STSデータセットで訓練、長文表現能力を強化
SOTA性能
中国語NLIテストセットで現時点最高性能を達成、平均スピアマン相関係数63.08
効率的推論
3066 QPSの推論速度をサポート、本番環境展開に適している

モデル能力

テキストベクトル化
文類似度計算
意味検索
テキストマッチング
特徴抽出

使用事例

情報検索
意味検索
クエリとドキュメントをベクトル変換後、類似度を計算し、キーワードではなく意味に基づく検索を実現
検索結果の関連性向上
インテリジェントカスタマーサポート
質問マッチング
ユーザ質問とナレッジベース質問の類似度を計算し、自動QAを実現
カスタマーサポートシステムの精度向上
テキストクラスタリング
ドキュメント分類
類似ドキュメントをベクトル距離でクラスタリング
教師なしドキュメント分類を実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase