MiniLM-L12xH384 XLM - R開源多語言模型 - 輕量實用助力多語言處理

首頁

Xlm Roberta Comet Small

由Unbabel開發

mMiniLM-L12xH384 XLM-R 是一個輕量化的多語言預訓練模型，基於 MiniLMv2 架構，通過關係蒸餾技術壓縮了傳統 XLM-RoBERTa 模型。

大型語言模型

Transformers

#輕量多語言模型 #機器翻譯優化 #自注意力蒸餾

下載量 45

發布時間 : 3/2/2022

模型概述

該模型是 XLM-RoBERTa 的輕量化版本，通過多頭自注意力關係蒸餾技術壓縮，適用於多語言自然語言處理任務。

模型特點

輕量化設計

相比傳統 XLM-RoBERTa 基礎版和大規模版更為輕量，適合資源受限環境

多語言支持

基於 XLM-R 架構，具備強大的多語言處理能力

關係蒸餾技術

採用 MiniLMv2 的多頭自注意力關係蒸餾方法，保持性能的同時減小模型規模

機器翻譯優化

使用 WMT 直接評估標註數據進行微調，特別適合機器翻譯相關任務

模型能力

多語言文本理解

跨語言表示學習

機器翻譯評估

文本分類

語義相似度計算

使用案例

機器翻譯

翻譯質量評估

利用微調後的模型評估機器翻譯結果的質量

在 WMT 數據集上表現良好

多語言預訓練

作為輕量級多語言預訓練模型用於下游任務

跨語言應用

跨語言信息檢索

用於不同語言文檔間的相似度計算和信息檢索

多語言文本分類

支持多種語言的文本分類任務

屬性	詳情
模型類型	MiniLM-L12xH384 XLM - R模型
訓練數據	WMT 2015至2020年收集的直接評估註釋

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Xlm Roberta Comet Small

模型概述

模型特點

模型能力

使用案例

🚀 輕量級多語言評估模型

🚀 快速開始

✨ 主要特性

📚 詳細文檔

模型信息

引用信息