Mt0 Xxl
mt0-xxl是BLOOMZ系列的多語言大模型,支持46種語言的跨語言任務處理,基於xP3數據集微調,擅長零樣本跨語言指令執行
下載量 1,914
發布時間 : 10/19/2022
模型概述
基於mT5架構的多語言大模型,通過xP3數據集微調實現跨語言任務泛化能力,支持文本生成、翻譯、問答等多種任務
模型特點
多語言零樣本學習
無需特定語言訓練即可處理46種語言的指令任務
跨任務泛化
在xP3混合任務數據集上微調,可泛化到未見過的任務類型
多任務統一處理
統一框架處理翻譯、問答、文本生成等多樣化任務
模型能力
多語言文本生成
跨語言翻譯
指代消解
自然語言推理
情感分析
問答系統
關鍵詞提取
使用案例
語言服務
多語言翻譯
支持46種語言間的互譯(如蒙古語-英語)
保持語義準確性的跨語言轉換
跨語言問答
用任意支持語言提問並獲得多語言回答
在XWinograd測試集上準確率達76-81%
內容生成
多語言故事創作
根據指定語言和主題生成連貫文本(如西班牙語童話)
保持文化適應性的創意輸出
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98