Text2vec Base Chinese
shibing624/text2vec-base-chineseをベースとした派生モデルで、MacBERTをLERTに置き換え、他のトレーニング条件はそのまま保持しています。中国語テキストのベクトル化と文類似度計算をサポートします。
ダウンロード数 1,613
リリース時間 : 3/7/2023
モデル概要
このモデルは中国語テキストベクトル化モデルで、主に特徴抽出と文類似度計算に使用されます。shibing624/text2vec-base-chineseの改良版で、元のアーキテクチャのMacBERTをLERTに置き換え、他のトレーニング条件は変更していません。
モデル特徴
LERTアーキテクチャ
元のモデルのMacBERTをLERTに置き換えることで、より優れた性能や効率性が得られる可能性があります。
ONNXサポート
ONNXランタイムバージョンを提供しており、様々なプラットフォームでのデプロイと推論が容易です。
中国語最適化
中国語テキストに特化して最適化されており、中国語自然言語処理タスクに適しています。
モデル能力
テキストベクトル化
特徴抽出
文類似度計算
使用事例
自然言語処理
意味検索
中国語の意味検索エンジンを構築するために使用でき、ベクトル類似度を通じて関連ドキュメントをマッチングします。
質問応答システム
質問と候補回答間の意味的類似度を計算するために使用されます。
テキストクラスタリング
テキストベクトル化を通じてドキュメントの自動分類とクラスタリングを実現します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98