Rut5 Small
mt5-smallをベースに改造したロシア語テキスト書き換えモデルで、語彙の削減により大幅にサイズを縮小、ロシア語テキスト書き換えタスクに適しています
ダウンロード数 2,139
リリース時間 : 3/2/2022
モデル概要
これはロシア語テキスト書き換えタスク向けに最適化された軽量モデルで、語彙を削減することでモデルサイズを大幅に縮小し、迅速な展開が必要なロシア語テキスト処理シナリオに適しています
モデル特徴
簡素化された語彙
96%の非ロシア語および低頻度語彙を削除し、語彙を25万から2万に削減、モデルサイズを大幅に縮小
効率的なロシア語処理
語彙はロシア語に特化して最適化されており、最初の5千語はオリジナルモデルから、残り1.5万語はロシア語ウェブコーパスの高頻度語から選定
軽量展開
モデルサイズをオリジナルの1.1GBから246MBに圧縮し、リソースが限られた環境での展開に適しています
モデル能力
ロシア語テキスト書き換え
ロシア語言い換え生成
複数候補結果生成
使用事例
テキスト処理
ロシア語コンテンツ書き換え
ロシア語テキストを同義で書き換え、元の意味を保ちつつ表現方法を変更
複数の書き換えバージョンを生成して選択可能
データ拡張
ロシア語NLPタスク向けに追加のトレーニングデータを生成
テキスト書き換えによりデータの多様性を増加
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98