S

Stella Large Zh V2

infgradによって開発
stella-large-zh-v2は文の類似度計算に特化した中国語モデルで、様々な意味的テキスト類似度タスクやテキスト分類タスクをサポートします。
ダウンロード数 259
リリース時間 : 10/13/2023

モデル概要

このモデルは主に文の類似度計算、テキスト分類、テキストクラスタリング、リランキングなどのタスクに使用され、複数の中国語評価ベンチマークで優れた性能を発揮します。

モデル特徴

マルチタスク評価ベンチマークサポート
MTEBなどの中国語マルチタスク評価ベンチマークで優れた性能を発揮し、意味的テキスト類似度、テキスト分類、テキストクラスタリング、リランキングなどのタスクをカバーします。
高性能文類似度計算
アント金融QA、ATEC、銀行QAなどのデータセットにおいて、文類似度計算の性能が突出しており、コサイン類似度、ユークリッド距離、マンハッタン距離など様々な距離指標をサポートします。
強力なリランキング能力
CMedQAv1とCMedQAv2のリランキングタスクにおいて、平均精度と平均逆順位がともに85%を超え、優れた性能を示します。

モデル能力

文類似度計算
テキスト分類
テキストクラスタリング
リランキング
検索

使用事例

金融分野
金融QAシステム
金融分野のQAシステムに使用され、ユーザーの質問と候補回答の類似度を計算します。
アント金融QAデータセットにおいて、コサイン類似度ピアソン値は47.34、スピアマン値は49.94でした。
銀行カスタマーサポートQA
銀行のカスタマーサポートシステムにおけるQAマッチングと類似度計算に使用されます。
銀行QAデータセットにおいて、コサイン類似度ピアソン値は62.83、スピアマン値は65.53でした。
医療分野
医療QAリランキング
医療QAシステムにおける回答のリランキングに使用され、回答の関連性を向上させます。
CMedQAv1とCMedQAv2のリランキングタスクにおいて、平均精度はそれぞれ85.44と85.82でした。
COVID-19情報検索
COVID-19関連情報の検索とランキングに使用されます。
COVID-19検索タスクにおいて、1位平均精度は68.86、トップ10平均精度は77.10でした。
汎用テキスト処理
テキスト分類
アマゾンレビュー分類などの汎用テキスト分類タスクに使用されます。
アマゾンレビュー分類(中国語)タスクにおいて、精度は40.81、F1スコアは39.02でした。
テキストクラスタリング
CLSポイントツーポイントや文ツー文クラスタリングなどのテキストクラスタリングタスクに使用されます。
CLSポイントツーポイントクラスタリングタスクにおいて、V測定値は39.95;文ツー文クラスタリングタスクにおいて、V測定値は38.18でした。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase