M

Mrt5 Small

stanfordnlpによって開発
MrT5はByT5の効率的な改良版で、動的トークン統合技術により入力シーケンス長を短縮し、処理効率を向上させます。
ダウンロード数 65
リリース時間 : 3/23/2025

モデル概要

MrT5はByT5を基にした改良モデルで、動的トークン削除メカニズムを導入し、エンコーダーでシーケンス長を短縮しながら重要な情報を保持します。多言語シーケンス間タスクに適しています。

モデル特徴

動的トークン統合
削除ゲートメカニズムにより入力シーケンス長を動的に短縮し、処理効率を向上させます。
多言語サポート
15種類の類型学的に多様な言語の処理をサポートします。
効率的な改良
ByT5ベースでわずか3000パラメータを追加し、削除ゲートメカニズムを実現しました。

モデル能力

多言語テキスト生成
シーケンス間変換
バイトレベル処理

使用事例

学術研究
言語モデル効率性研究
動的トークン統合技術が言語モデルの効率に与える影響を研究します。
テキスト処理
多言語テキスト要約
多言語テキストの要約を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase