ConGen-paraphrase-multilingual-mpnet-base-v2オープンソースモデル

ホーム

Congen Paraphrase Multilingual Mpnet Base V2

kornwtpによって開発

これはConGenフレームワークに基づく多言語文埋め込みモデルで、文を768次元のベクトル空間にマッピングでき、意味的検索などのタスクに適しています。

テキスト埋め込み

Transformers

オープンソースライセンス:Apache-2.0 #多言語文埋め込み #意味的類似度計算 #768次元ベクトル空間

ダウンロード数 329

リリース時間 : 12/6/2022

モデル概要

このモデルはConGenフレームワークを使用して訓練され、文を768次元の密なベクトル表現に変換でき、主に文の類似度計算と意味的検索タスクに使用されます。

モデル特徴

多言語サポート

タイ語を含む複数の言語の処理をサポートします

高次元ベクトル表現

文を768次元の密なベクトル空間にマッピングします

ConGenフレームワークに基づく

教師なし制御と汎化蒸留技術を用いて訓練されます

モデル能力

文のベクトル化

意味的類似度計算

多言語テキスト処理

使用事例

情報検索

意味的検索

文のベクトルを使用して類似文書を検索します

自然言語処理

文の類似度計算

2つの文間の意味的類似度を計算します

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Congen Paraphrase Multilingual Mpnet Base V2

モデル概要

モデル特徴

モデル能力

使用事例

🚀 kornwtp/ConGen-paraphrase-multilingual-mpnet-base-v2

🚀 クイックスタート

📦 インストール

💻 使用例

基本的な使用法

📚 ドキュメント

📄 ライセンス

📄 引用と著者