# ORPO微調

Schreiber Mistral Nemo 12B
Apache-2.0
Schreiber-mistral-nemo-12B 是基於 mistral-nemo-kartoffel-12B 微調的大型語言模型,專注於提供更強大和精準的語言處理能力。
大型語言模型 Transformers
S
nbeerbower
107
1
Qwq Bakeneko 32b
Apache-2.0
基於Qwen2.5-32B和QwQ-32B合併優化的日語對話模型,通過Chat Vector和ORPO技術增強指令跟隨能力
大型語言模型 Transformers 日語
Q
rinna
1,597
17
Llama3.1 Gutenberg Doppel 70B
基於Hermes-3-Llama-3.1-70B-lorablated模型,在Gutenberg數據集上進行微調的大語言模型
大型語言模型 Transformers
L
nbeerbower
424
6
Calmerys 78B Orpo V0.1
MIT
基於MaziyarPanahi/calme-2.4-rys-78b在mlabonne/orpo-dpo-mix-40k數據集上微調的大語言模型,在Open LLM Leaderboard上排名第一
大型語言模型 Transformers 英語
C
dfurman
353
74
Orpo Mistral 7B V0.3
該模型是基於Mistral-7B-v0.3進行ORPO微調的版本,整合了監督微調和偏好對齊階段,適用於聊天和文本生成任務。
大型語言模型 Transformers 英語
O
MuntasirHossain
385
2
Llama3 70B Chinese Chat
Llama3-70B-Chinese-Chat是基於Meta-Llama-3-70B-Instruct開發的中英文雙語大語言模型,專為中英文用戶設計,具備角色扮演、工具使用和數學計算等多種能力。
大型語言模型 Transformers 支持多種語言
L
shenzhi-wang
58
102
Llama Medx V3.2
Llama-medx_v3.2 是專為醫療領域微調的大語言模型,基於 Meta-Llama-3.1-8B 架構開發,通過監督式微調(SFT)與優勢比偏好優化(ORPO)技術訓練,精準掌握醫學術語與臨床推理能力。
大型語言模型 Transformers
L
skumar9
5,677
12
Arabic Orpo Llama 3 8B Instruct
基於Llama-3-8B-Instruct微調的阿拉伯語文本生成模型,專注於提升阿拉伯語文本的連貫性和準確性。
大型語言模型 Transformers 阿拉伯語
A
MohamedRashad
5,764
15
Suzume Llama 3 8B Multilingual Orpo Borda Top75
基於lightblue/suzume-llama-3-8B-multilingual通過ORPO方法微調訓練的多語言大語言模型
大型語言模型 Transformers
S
lightblue
1,771
4
Suzume Llama 3 8B Multilingual Orpo Borda Half
基於Llama-3-8B通過ORPO方法微調的多語言大模型,使用50%最一致排名數據訓練,在多項語言任務中表現優異。
大型語言模型 Transformers
S
lightblue
4,625
16
Llama3 8B Chinese Chat
基於Meta-Llama-3-8B-Instruct微調的中英文對話模型,優化了中文回答質量,減少中英文混雜問題。
大型語言模型 Transformers 支持多種語言
L
shenzhi-wang
2,777
678
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase