Condor-Opus-14B-Exp開源大語言模型 - 增強推理，支持多語言和長上下文處理

首頁

Condor Opus 14B Exp

由prithivMLmods開發

Condor-Opus-14B-Exp 是基於 Qwen 2.5 14B 模態架構設計的大語言模型，專注於增強推理能力，支持多語言和長上下文處理。

大型語言模型

Transformers

支持多種語言開源協議:Apache-2.0 #長鏈推理優化 #多語言生成 #128K上下文

下載量 99

發布時間 : 3/2/2025

模型概述

該模型針對通用推理和回答進行了優化，在上下文理解、邏輯推理和多步驟問題解決方面表現出色。通過長鏈思維推理模型和專用數據集的微調，提升了理解能力、結構化響應和對話智能。

模型特點

增強的通用知識

提供跨領域的廣泛知識，提高了準確回答問題並生成連貫響應的能力。

改進的指令遵循

在理解和遵循複雜指令、生成結構化響應以及保持長時間交互的連貫性方面取得了顯著進展。

多功能適應性

對多樣化提示更具彈性，提升了處理廣泛主題和對話風格的能力，包括開放式和結構化查詢。

長上下文支持

支持高達 128K 的輸入上下文標記，並能生成高達 8K 標記的單次輸出，適合生成詳細響應。

多語言能力

支持超過 29 種語言，包括英語、中文、法語、西班牙語等。

模型能力

文本生成

邏輯推理

多步驟問題解決

多語言支持

長文本生成

結構化響應生成

使用案例

通用推理

邏輯推理

適用於廣泛的邏輯推理、回答多樣化問題和解決通用知識問題。

教育和信息輔助

教育輔助

適合為學生、教育工作者和普通用戶提供解釋、摘要和研究性回答。

對話式 AI 和聊天機器人

智能對話代理

適用於構建需要上下文理解和動態響應生成的智能對話代理。

多語言應用

多語言內容生成

支持全球通信、翻譯和多語言內容生成。

結構化數據處理

結構化輸出生成

能夠分析和生成結構化輸出，如表格和 JSON，適用於數據科學和自動化。

長文本內容生成

文章生成

可以生成擴展響應，包括文章、報告和指南，保持大篇幅文本輸出的連貫性。

🚀 Condor-Opus-14B-Exp

Condor-Opus-14B-Exp 基於 Qwen 2.5 14B 模態架構，旨在增強 14B 參數模型的推理能力。該模型針對通用推理和回答進行了優化，在上下文理解、邏輯演繹和多步驟問題解決方面表現出色。它使用長思維鏈推理模型和專門的數據集進行了微調，以提高理解能力、結構化響應和對話智能。

🚀 快速開始

以下是使用 apply_chat_template 加載分詞器和模型並生成內容的代碼片段：

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "prithivMLmods/Condor-Opus-14B-Exp"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "What are the key principles of general-purpose AI?"
messages = [
    {"role": "system", "content": "You are a helpful assistant capable of answering a wide range of questions."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

✨ 主要特性

增強的常識知識：該模型提供跨多個領域的廣泛知識，提高了準確回答問題和生成連貫響應的能力。
改進的指令遵循能力：在理解和遵循複雜指令、生成結構化響應以及在長時間交互中保持連貫性方面取得了顯著進展。
多功能適應性：對各種提示更具彈性，增強了處理廣泛主題和對話風格的能力，包括開放式和結構化查詢。
長上下文支持：支持最多 128K 個輸入上下文標記，並可以在一次輸出中生成最多 8K 個標記，非常適合詳細響應。
多語言能力：支持超過 29 種語言，包括英語、中文、法語、西班牙語、葡萄牙語、德語、意大利語、俄語、日語、韓語、越南語、泰語、阿拉伯語等。

💻 使用示例

基礎用法

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "prithivMLmods/Condor-Opus-14B-Exp"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "What are the key principles of general-purpose AI?"
messages = [
    {"role": "system", "content": "You are a helpful assistant capable of answering a wide range of questions."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]