Opus Mt En Zle
これはTransformerアーキテクチャに基づく多言語翻訳モデルで、英語からベラルーシ語、ロシア語、ウクライナ語など、さまざまな東スラブ言語への翻訳をサポートします。
ダウンロード数 59
リリース時間 : 3/2/2022
モデル概要
このモデルは英語から東スラブ語族への機械翻訳タスクに特化しており、標準化前処理とSentencePieceトークン化技術を採用し、複数のターゲット言語バリアントをサポートします。
モデル特徴
多言語サポート
英語からベラルーシ語(キリル/ラテン)、ロシア語、ウクライナ語など、複数の東スラブ言語への翻訳をサポートします。
前処理最適化
標準化前処理とSentencePieceトークン化技術(spm32k)を採用し、翻訳品質を向上させます。
言語識別子
ターゲット言語ID(例:>>rus<<)を追加することで、多言語ターゲット出力の柔軟な制御を実現します。
モデル能力
英語からベラルーシ語翻訳
英語からロシア語翻訳
英語からウクライナ語翻訳
英語から古代教会スラブ語翻訳
英語からルシン語翻訳
使用事例
ニュース翻訳
ニュースコンテンツ翻訳
英語ニュースを東スラブ語族言語に翻訳
newstest2012-2019テストセットでBLEUスコア21.4-27.4
日常会話翻訳
日常会話翻訳
英語の日常会話を東スラブ語族言語に翻訳
TatoebaテストセットでBLEUスコア20.8-41.3
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98