stella-large-zh-v2オープンソース中国語モデル - 無料で文の類似度計算とテキスト分類を実現

ホーム

Stella Large Zh V2

infgradによって開発

stella-large-zh-v2は文の類似度計算に特化した中国語モデルで、様々な意味的テキスト類似度タスクやテキスト分類タスクをサポートします。

テキスト埋め込み

PyTorch

#金融QA類似度 #マルチタスク評価 #中国語意味理解

ダウンロード数 259

リリース時間 : 10/13/2023

モデル概要

このモデルは主に文の類似度計算、テキスト分類、テキストクラスタリング、リランキングなどのタスクに使用され、複数の中国語評価ベンチマークで優れた性能を発揮します。

モデル特徴

マルチタスク評価ベンチマークサポート

MTEBなどの中国語マルチタスク評価ベンチマークで優れた性能を発揮し、意味的テキスト類似度、テキスト分類、テキストクラスタリング、リランキングなどのタスクをカバーします。

高性能文類似度計算

アント金融QA、ATEC、銀行QAなどのデータセットにおいて、文類似度計算の性能が突出しており、コサイン類似度、ユークリッド距離、マンハッタン距離など様々な距離指標をサポートします。

強力なリランキング能力

CMedQAv1とCMedQAv2のリランキングタスクにおいて、平均精度と平均逆順位がともに85%を超え、優れた性能を示します。

モデル能力

文類似度計算

テキスト分類

テキストクラスタリング

リランキング

検索

使用事例

金融分野

金融QAシステム

金融分野のQAシステムに使用され、ユーザーの質問と候補回答の類似度を計算します。

アント金融QAデータセットにおいて、コサイン類似度ピアソン値は47.34、スピアマン値は49.94でした。

銀行カスタマーサポートQA

銀行のカスタマーサポートシステムにおけるQAマッチングと類似度計算に使用されます。

銀行QAデータセットにおいて、コサイン類似度ピアソン値は62.83、スピアマン値は65.53でした。

医療分野

医療QAリランキング

医療QAシステムにおける回答のリランキングに使用され、回答の関連性を向上させます。

CMedQAv1とCMedQAv2のリランキングタスクにおいて、平均精度はそれぞれ85.44と85.82でした。

COVID-19情報検索

COVID-19関連情報の検索とランキングに使用されます。

COVID-19検索タスクにおいて、1位平均精度は68.86、トップ10平均精度は77.10でした。

汎用テキスト処理

テキスト分類

アマゾンレビュー分類などの汎用テキスト分類タスクに使用されます。

アマゾンレビュー分類（中国語）タスクにおいて、精度は40.81、F1スコアは39.02でした。

テキストクラスタリング

CLSポイントツーポイントや文ツー文クラスタリングなどのテキストクラスタリングタスクに使用されます。

CLSポイントツーポイントクラスタリングタスクにおいて、V測定値は39.95；文ツー文クラスタリングタスクにおいて、V測定値は38.18でした。

🚀 stella-large-zh-v2

このモデルは文の類似度を測定するためのもので、sentence-transformersをベースにしており、特徴抽出や文の類似度判定、MTEBのタスクに適用できます。

📚 ドキュメント

モデル情報

プロパティ	詳細
パイプラインタグ	文の類似度
タグ	sentence-transformers、特徴抽出、文の類似度、mteb
モデル名	stella-large-zh-v2

評価結果

1. STSタスク

MTEB AFQMC (validation)

指標	値
cos_sim_pearson	47.34436411023816
cos_sim_spearman	49.947084806624545
euclidean_pearson	48.128834319004824
euclidean_spearman	49.947064694876815
manhattan_pearson	48.083561270166484
manhattan_spearman	49.90207128584442

MTEB ATEC (test)

指標	値
cos_sim_pearson	50.97998570817664
cos_sim_spearman	53.11852606980578
euclidean_pearson	55.12610520736481
euclidean_spearman	53.11852832108405
manhattan_pearson	55.10299116717361
manhattan_spearman	53.11304196536268

MTEB BQ (test)

指標	値
cos_sim_pearson	62.83544115057508
cos_sim_spearman	65.53509404838948
euclidean_pearson	64.08198144850084
euclidean_spearman	65.53509404760305
manhattan_pearson	64.08808420747272
manhattan_spearman	65.54907862648346

MTEB LCQMC (test)

指標	値
cos_sim_pearson	71.17149643620844
cos_sim_spearman	77.48040046337948
euclidean_pearson	76.32337539923347
euclidean_spearman	77.4804004621894
manhattan_pearson	76.33275226275444
manhattan_spearman	77.48979843086128

2. Classificationタスク

MTEB AmazonReviewsClassification (zh) (test)

指標値

正解率 40.81799999999999

F1値 39.022194031906444
MTEB IFlyTek (validation)

指標値

正解率 47.98768757214313

F1値 35.23884426992269
MTEB JDReview (test)

指標値

正解率 86.97936210131333

AP 56.292679530375736

F1値 81.87001614762136
MTEB MassiveIntentClassification (zh-CN) (test)

指標値

正解率 68.26160053799597

F1値 65.96949453305112
MTEB MassiveScenarioClassification (zh-CN) (test)

指標値

正解率 73.12037659717554

F1値 72.69052407105445

指標	値
正解率	40.81799999999999
F1値	39.022194031906444

指標	値
正解率	47.98768757214313
F1値	35.23884426992269

指標	値
正解率	86.97936210131333
AP	56.292679530375736
F1値	81.87001614762136

指標	値
正解率	68.26160053799597
F1値	65.96949453305112

指標	値
正解率	73.12037659717554
F1値	72.69052407105445

3. Clusteringタスク

MTEB CLSClusteringP2P (test)

指標値

v_measure 39.95428546140963
MTEB CLSClusteringS2S (test)

指標値

v_measure 38.18454393512963

指標	値
v_measure	39.95428546140963

指標	値
v_measure	38.18454393512963

4. Rerankingタスク

MTEB CMedQAv1 (test)

指標値

MAP 85.4453602559479

MRR 88.1418253968254
MTEB CMedQAv2 (test)

指標値

MAP 85.82731720256984

MRR 88.53230158730159
MTEB MMarcoReranking (dev)

指標値

MAP 27.966807589556826

MRR 26.92023809523809

指標	値
MAP	85.4453602559479
MRR	88.1418253968254

指標	値
MAP	85.82731720256984
MRR	88.53230158730159

指標	値
MAP	27.966807589556826
MRR	26.92023809523809

5. Retrievalタスク

MTEB CmedqaRetrieval (dev) （多数の指標がありますが、省略します。詳細は元の文書を参照してください。）
MTEB CovidRetrieval (dev) （多数の指標がありますが、省略します。詳細は元の文書を参照してください。）
MTEB DuRetrieval (dev) （多数の指標がありますが、省略します。詳細は元の文書を参照してください。）
MTEB EcomRetrieval (dev) （多数の指標がありますが、省略します。詳細は元の文書を参照してください。）
MTEB MedicalRetrieval (dev)

指標値

map_at_1 50.1

map_at_10 56.489999999999995

map_at_100 57.007

map_at_1000 57.06400000000001

map_at_3 （元の文書で未記載）