ORPO微調

# ORPO微調

Schreiber Mistral Nemo 12B

Schreiber-mistral-nemo-12B 是基於 mistral-nemo-kartoffel-12B 微調的大型語言模型，專注於提供更強大和精準的語言處理能力。

大型語言模型

Qwq Bakeneko 32b

基於Qwen2.5-32B和QwQ-32B合併優化的日語對話模型，通過Chat Vector和ORPO技術增強指令跟隨能力

大型語言模型

Transformers 日語

Llama3.1 Gutenberg Doppel 70B

基於Hermes-3-Llama-3.1-70B-lorablated模型，在Gutenberg數據集上進行微調的大語言模型

大型語言模型

Calmerys 78B Orpo V0.1

基於MaziyarPanahi/calme-2.4-rys-78b在mlabonne/orpo-dpo-mix-40k數據集上微調的大語言模型，在Open LLM Leaderboard上排名第一

大型語言模型

Transformers 英語

Orpo Mistral 7B V0.3

該模型是基於Mistral-7B-v0.3進行ORPO微調的版本，整合了監督微調和偏好對齊階段，適用於聊天和文本生成任務。

大型語言模型

Transformers 英語

MuntasirHossain

Llama3 70B Chinese Chat

Llama3-70B-Chinese-Chat是基於Meta-Llama-3-70B-Instruct開發的中英文雙語大語言模型，專為中英文用戶設計，具備角色扮演、工具使用和數學計算等多種能力。

大型語言模型

Transformers 支持多種語言

Llama Medx V3.2

Llama-medx_v3.2 是專為醫療領域微調的大語言模型，基於 Meta-Llama-3.1-8B 架構開發，通過監督式微調（SFT）與優勢比偏好優化（ORPO）技術訓練，精準掌握醫學術語與臨床推理能力。

大型語言模型

Arabic Orpo Llama 3 8B Instruct

基於Llama-3-8B-Instruct微調的阿拉伯語文本生成模型，專注於提升阿拉伯語文本的連貫性和準確性。

大型語言模型

Transformers 阿拉伯語

Suzume Llama 3 8B Multilingual Orpo Borda Top75

基於lightblue/suzume-llama-3-8B-multilingual通過ORPO方法微調訓練的多語言大語言模型

大型語言模型

Suzume Llama 3 8B Multilingual Orpo Borda Half

基於Llama-3-8B通過ORPO方法微調的多語言大模型，使用50%最一致排名數據訓練，在多項語言任務中表現優異。

大型語言模型

Llama3 8B Chinese Chat

基於Meta-Llama-3-8B-Instruct微調的中英文對話模型，優化了中文回答質量，減少中英文混雜問題。

大型語言模型

Transformers 支持多種語言

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase