I

It5 Base Oscar

gsartiによって開発
イタリア語向けに大規模なシーケンス・ツー・シーケンスTransformerモデルの事前学習を初めて実施したプロジェクトで、OSCARコーパスを用いて学習
ダウンロード数 19
リリース時間 : 3/2/2022

モデル概要

このモデルはIT5モデルファミリーのベースバージョンで、イタリア語向けに特別に事前学習されており、T5アーキテクチャを採用し、様々なシーケンス・ツー・シーケンスタスクに適用可能

モデル特徴

イタリア語専用事前学習
イタリア語向けに大規模な事前学習を初めて実施したシーケンス・ツー・シーケンスTransformerモデル
OSCARコーパスベース
OSCARコーパスのイタリア語部分を使用して学習
改良版トークナイザー
mC4イタリア語部分で学習されたSentencePieceUnigramTokenizerを採用
TPU最適化学習
Google CloudのTPU3v8-VMマシンで学習を完了し、Google TPU研究クラウドの支援を受けた

モデル能力

イタリア語テキスト理解
イタリア語テキスト生成
シーケンス・ツー・シーケンス変換

使用事例

自然言語処理
自然言語推論
前提-仮説関係の判断など、自然言語推論タスクに使用可能
微調整モデルgsarti/it5-base-nliを参照
テキスト要約
イタリア語テキストの自動要約生成に使用可能
機械翻訳
イタリア語関連の翻訳タスクに使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase