text2vec-base-chineseオープンソースモデル - 中国語テキストのベクトル化と文章の類似度計算をサポート！

ホーム

Text2vec Base Chinese

GanymedeNilによって開発

shibing624/text2vec-base-chineseをベースとした派生モデルで、MacBERTをLERTに置き換え、他のトレーニング条件はそのまま保持しています。中国語テキストのベクトル化と文類似度計算をサポートします。

テキスト埋め込み

Transformers

中国語オープンソースライセンス:Apache-2.0 #LERTベクトル化 #中国語文類似度 #ONNX推論最適化

ダウンロード数 1,613

リリース時間 : 3/7/2023

モデル概要

このモデルは中国語テキストベクトル化モデルで、主に特徴抽出と文類似度計算に使用されます。shibing624/text2vec-base-chineseの改良版で、元のアーキテクチャのMacBERTをLERTに置き換え、他のトレーニング条件は変更していません。

モデル特徴

LERTアーキテクチャ

元のモデルのMacBERTをLERTに置き換えることで、より優れた性能や効率性が得られる可能性があります。

ONNXサポート

ONNXランタイムバージョンを提供しており、様々なプラットフォームでのデプロイと推論が容易です。

中国語最適化

中国語テキストに特化して最適化されており、中国語自然言語処理タスクに適しています。

モデル能力

テキストベクトル化

特徴抽出

文類似度計算

使用事例

自然言語処理

意味検索

中国語の意味検索エンジンを構築するために使用でき、ベクトル類似度を通じて関連ドキュメントをマッチングします。

質問応答システム

質問と候補回答間の意味的類似度を計算するために使用されます。

テキストクラスタリング

テキストベクトル化を通じてドキュメントの自動分類とクラスタリングを実現します。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Text2vec Base Chinese

モデル概要

モデル特徴

モデル能力

使用事例

🚀 テキスト2ベクトル派生モデル

🚀 クイックスタート

📄 ライセンス

📚 ドキュメント

ニュース