LaBSE-en-ru-myv-v2オープンソース多言語埋め込みモデル - ロシア語とモクシャ語の高精度なアプリケーションをサポート

ホーム

Labse En Ru Myv V2

sloneによって開発

これはLaBSEモデルに基づく多言語埋め込みモデルで、ロシア語とモクシャ語をサポートし、myv_ru_2022データセットでファインチューニングされています。

大規模言語モデル

Transformers

その他#ロシア語-モクシャ語バイリンガル #マスク言語モデル最適化 #テキスト特徴抽出

ダウンロード数 59

リリース時間 : 11/1/2023

モデル概要

このモデルはLaBSEモデルのバリエーションで、特にロシア語とモクシャ語向けに最適化されており、バイリンガルテキストマイニングやマスク言語モデルタスクに適しています。

モデル特徴

バイリンガルサポート

ロシア語とモクシャ語向けに特別に最適化されています

性能向上

v1バージョンと比較して、バイリンガルテキストマイニングとマスク言語モデルタスクでより優れたパフォーマンスを発揮します

事前学習+ファインチューニング

LaBSEモデルをベースに、myv_ru_2022データセットで約15万ステップのファインチューニングを行いました

モデル能力

テキスト埋め込み

文類似度計算

マスク言語モデリング

特徴抽出

使用事例

自然言語処理

バイリンガルテキストマイニング

ロシア語とモクシャ語間のテキスト類似性分析とマイニングに使用されます

v1バージョンと比較して性能が向上しています

言語モデルタスク

マスク埋めなどの言語モデルタスクに使用されます

モクシャ語タスクで良好なパフォーマンスを発揮します

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Labse En Ru Myv V2

モデル概要

モデル特徴

モデル能力

使用事例

🚀 LaBSE-en-ru-myv-v2

🚀 クイックスタート

📄 ライセンス