S

Suzume Llama 3 8B Multilingual Orpo Borda Half

由lightblue開發
基於Llama-3-8B通過ORPO方法微調的多語言大模型,使用50%最一致排名數據訓練,在多項語言任務中表現優異。
下載量 4,625
發布時間 : 4/25/2024

模型概述

這是一個通過ORPO(Odds Ratio Preference Optimization)方法微調的多語言大語言模型,基於Llama-3-8B架構,專門優化了多語言理解和生成能力。

模型特點

ORPO優化訓練
使用Odds Ratio Preference Optimization方法微調,顯著提升模型在多語言任務中的表現
多語言能力
在6種主要語言(中英法德日俄)上均有優異表現,部分語言超越GPT-3.5
數據精選
使用50%最一致排名數據訓練,確保訓練質量
長上下文支持
支持8192 tokens的長上下文處理

模型能力

多語言文本生成
多語言問答
多語言對話系統
多語言文本理解

使用案例

多語言應用
多語言客服機器人
構建支持多種語言的智能客服系統
在MT-Bench測試中,俄語表現最佳(8.94分),中文7.74分
多語言內容創作
輔助生成多種語言的營銷文案、文章等內容
在法語和德語測試中表現優於基礎模型
研究應用
ORPO方法研究
研究不同比例訓練數據對模型性能的影響
50%數據版本在多項測試中表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase