F

Flan T5 Xxl Sharded Fp16

由philschmid開發
FLAN-T5 XXL 是Google發佈的T5模型變體,在超過1000個額外任務上進行了微調,支持多種語言,性能優於原始T5模型。
下載量 531
發布時間 : 1/27/2023

模型概述

這是google/flan-t5-xxl的一個分支版本,實現了自定義的handler.py,作為在單個NVIDIA A10G上通過推理終端使用t5-11b的示例。

模型特點

多任務微調
在超過1000個額外任務上進行了微調,涵蓋多種語言和任務類型
量化版本
支持在單個NVIDIA A10G GPU上運行,降低了硬件需求
多語言支持
支持60多種語言的處理和生成
性能優越
在相同參數規模下,性能優於原始T5模型

模型能力

文本生成
問答系統
多語言翻譯
指令理解
文本摘要

使用案例

自然語言處理
多語言問答系統
構建支持多種語言的智能問答系統
在五樣本MMLU上達到75.2%的準確率
文本摘要
自動生成文章或文檔的摘要
機器翻譯
支持多種語言之間的互譯
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase