Stella Large Zh V2
モデル概要
このモデルは主に文の類似度計算、テキスト分類、テキストクラスタリング、リランキングなどのタスクに使用され、複数の中国語評価ベンチマークで優れた性能を発揮します。
モデル特徴
マルチタスク評価ベンチマークサポート
MTEBなどの中国語マルチタスク評価ベンチマークで優れた性能を発揮し、意味的テキスト類似度、テキスト分類、テキストクラスタリング、リランキングなどのタスクをカバーします。
高性能文類似度計算
アント金融QA、ATEC、銀行QAなどのデータセットにおいて、文類似度計算の性能が突出しており、コサイン類似度、ユークリッド距離、マンハッタン距離など様々な距離指標をサポートします。
強力なリランキング能力
CMedQAv1とCMedQAv2のリランキングタスクにおいて、平均精度と平均逆順位がともに85%を超え、優れた性能を示します。
モデル能力
文類似度計算
テキスト分類
テキストクラスタリング
リランキング
検索
使用事例
金融分野
金融QAシステム
金融分野のQAシステムに使用され、ユーザーの質問と候補回答の類似度を計算します。
アント金融QAデータセットにおいて、コサイン類似度ピアソン値は47.34、スピアマン値は49.94でした。
銀行カスタマーサポートQA
銀行のカスタマーサポートシステムにおけるQAマッチングと類似度計算に使用されます。
銀行QAデータセットにおいて、コサイン類似度ピアソン値は62.83、スピアマン値は65.53でした。
医療分野
医療QAリランキング
医療QAシステムにおける回答のリランキングに使用され、回答の関連性を向上させます。
CMedQAv1とCMedQAv2のリランキングタスクにおいて、平均精度はそれぞれ85.44と85.82でした。
COVID-19情報検索
COVID-19関連情報の検索とランキングに使用されます。
COVID-19検索タスクにおいて、1位平均精度は68.86、トップ10平均精度は77.10でした。
汎用テキスト処理
テキスト分類
アマゾンレビュー分類などの汎用テキスト分類タスクに使用されます。
アマゾンレビュー分類(中国語)タスクにおいて、精度は40.81、F1スコアは39.02でした。
テキストクラスタリング
CLSポイントツーポイントや文ツー文クラスタリングなどのテキストクラスタリングタスクに使用されます。
CLSポイントツーポイントクラスタリングタスクにおいて、V測定値は39.95;文ツー文クラスタリングタスクにおいて、V測定値は38.18でした。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98