M

Mt0 Xxl

由bigscience開發
mt0-xxl是BLOOMZ系列的多語言大模型,支持46種語言的跨語言任務處理,基於xP3數據集微調,擅長零樣本跨語言指令執行
下載量 1,914
發布時間 : 10/19/2022

模型概述

基於mT5架構的多語言大模型,通過xP3數據集微調實現跨語言任務泛化能力,支持文本生成、翻譯、問答等多種任務

模型特點

多語言零樣本學習
無需特定語言訓練即可處理46種語言的指令任務
跨任務泛化
在xP3混合任務數據集上微調,可泛化到未見過的任務類型
多任務統一處理
統一框架處理翻譯、問答、文本生成等多樣化任務

模型能力

多語言文本生成
跨語言翻譯
指代消解
自然語言推理
情感分析
問答系統
關鍵詞提取

使用案例

語言服務
多語言翻譯
支持46種語言間的互譯(如蒙古語-英語)
保持語義準確性的跨語言轉換
跨語言問答
用任意支持語言提問並獲得多語言回答
在XWinograd測試集上準確率達76-81%
內容生成
多語言故事創作
根據指定語言和主題生成連貫文本(如西班牙語童話)
保持文化適應性的創意輸出
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase