ORPO微调

# ORPO微调

Schreiber Mistral Nemo 12B

Schreiber-mistral-nemo-12B 是基于 mistral-nemo-kartoffel-12B 微调的大型语言模型，专注于提供更强大和精准的语言处理能力。

大型语言模型

Qwq Bakeneko 32b

基于Qwen2.5-32B和QwQ-32B合并优化的日语对话模型，通过Chat Vector和ORPO技术增强指令跟随能力

大型语言模型

Transformers 日语

Llama3.1 Gutenberg Doppel 70B

基于Hermes-3-Llama-3.1-70B-lorablated模型，在Gutenberg数据集上进行微调的大语言模型

大型语言模型

Calmerys 78B Orpo V0.1

基于MaziyarPanahi/calme-2.4-rys-78b在mlabonne/orpo-dpo-mix-40k数据集上微调的大语言模型，在Open LLM Leaderboard上排名第一

大型语言模型

Transformers 英语

Orpo Mistral 7B V0.3

该模型是基于Mistral-7B-v0.3进行ORPO微调的版本，整合了监督微调和偏好对齐阶段，适用于聊天和文本生成任务。

大型语言模型

Transformers 英语

MuntasirHossain

Llama3 70B Chinese Chat

Llama3-70B-Chinese-Chat是基于Meta-Llama-3-70B-Instruct开发的中英文双语大语言模型，专为中英文用户设计，具备角色扮演、工具使用和数学计算等多种能力。

大型语言模型

Transformers 支持多种语言

Llama Medx V3.2

Llama-medx_v3.2 是专为医疗领域微调的大语言模型，基于 Meta-Llama-3.1-8B 架构开发，通过监督式微调（SFT）与优势比偏好优化（ORPO）技术训练，精准掌握医学术语与临床推理能力。

大型语言模型

Arabic Orpo Llama 3 8B Instruct

基于Llama-3-8B-Instruct微调的阿拉伯语文本生成模型，专注于提升阿拉伯语文本的连贯性和准确性。

大型语言模型

Transformers 阿拉伯语

Suzume Llama 3 8B Multilingual Orpo Borda Top75

基于lightblue/suzume-llama-3-8B-multilingual通过ORPO方法微调训练的多语言大语言模型

大型语言模型

Suzume Llama 3 8B Multilingual Orpo Borda Half

基于Llama-3-8B通过ORPO方法微调的多语言大模型，使用50%最一致排名数据训练，在多项语言任务中表现优异。

大型语言模型

Llama3 8B Chinese Chat

基于Meta-Llama-3-8B-Instruct微调的中英文对话模型，优化了中文回答质量，减少中英文混杂问题。

大型语言模型

Transformers 支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase