Flan T5 Xxl Sharded Fp16
FLAN-T5 XXLはGoogleがリリースしたT5モデルのバリアントで、1000以上の追加タスクでファインチューニングされており、複数の言語をサポートし、オリジナルのT5モデルよりも優れた性能を発揮します。
ダウンロード数 531
リリース時間 : 1/27/2023
モデル概要
これはgoogle/flan-t5-xxlのフォークバージョンで、カスタムhandler.pyを実装し、単一のNVIDIA A10G上でt5-11bを推論エンドポイントとして使用する例です。
モデル特徴
マルチタスクファインチューニング
1000以上の追加タスクでファインチューニングされており、複数の言語とタスクタイプをカバーしています
量子化バージョン
単一のNVIDIA A10G GPUで動作可能で、ハードウェア要件を低減しています
多言語サポート
60以上の言語の処理と生成をサポートしています
優れた性能
同じパラメータ規模で、オリジナルのT5モデルよりも優れた性能を発揮します
モデル能力
テキスト生成
質問応答システム
多言語翻訳
命令理解
テキスト要約
使用事例
自然言語処理
多言語質問応答システム
複数言語をサポートするインテリジェントな質問応答システムを構築
5サンプルMMLUで75.2%の精度を達成
テキスト要約
記事やドキュメントの要約を自動生成
機械翻訳
複数言語間の相互翻訳をサポート
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98