Theta-Lyrae-Qwen-14B開源AI模型 - 優化推理問答，解決多步驟問題超給力

首頁

Theta Lyrae Qwen 14B

由prithivMLmods開發

Theta-Lyrae-Qwen-14B是基於Qwen 2.5 14B模態架構設計的140億參數模型，優化了通用推理和問答能力，在上下文理解、邏輯推理和多步驟問題解決方面表現優異。

大型語言模型

Transformers

開源協議:Apache-2.0 #長上下文推理 #多領域問答 #結構化輸出生成

下載量 21

發布時間 : 3/14/2025

模型概述

該模型通過長鏈思維推理模型和專用數據集的微調，提升了理解能力、結構化響應和對話智能，支持128K令牌的輸入上下文和8K令牌的單次輸出。

模型特點

增強的通用知識

覆蓋多領域知識，提升準確回答問題及生成連貫響應的能力。

改進的指令遵循

顯著提升對複雜指令的理解與執行能力，生成結構化響應並保持長對話一致性。

多樣化適應力

對多樣化提示更具韌性，可處理開放式與結構化提問等廣泛話題。

長上下文支持

支持128K令牌的輸入上下文，單次輸出可達8K令牌，適合生成詳細回答。

模型能力

文本生成

邏輯推理

問答

多步驟問題解決

結構化響應生成

長文本生成

使用案例

通用推理

邏輯推理

適用於邏輯推理、多樣化問答及常識問題解決。

生成連貫且邏輯性強的回答

教育信息輔助

教育解釋

為學生、教育者及普通用戶提供解釋、摘要和研究型回答。

提供清晰且易於理解的教育內容

對話AI與聊天機器人

智能對話代理

適合構建需上下文理解和動態響應生成的智能對話代理。

保持對話一致性和上下文連貫性

結構化數據處理

數據科學與自動化

可分析生成表格、JSON等結構化輸出，適用於數據科學與自動化。

生成結構化且易於處理的數據

長文本生成

文章與報告生成

能生成文章、報告等長篇內容並保持連貫性。

生成長篇且內容連貫的文本

🚀 Theta-Lyrae-Qwen-14B

Theta-Lyrae-Qwen-14B基於Qwen 2.5 14B模態架構，旨在提升14B參數模型的推理能力。該模型針對通用推理和回答進行了優化，在上下文理解、邏輯演繹和多步驟問題解決方面表現出色。它使用長思維鏈推理模型和專業數據集進行了微調，以提高理解能力、結構化響應和對話智能。

🚀 快速開始

以下是使用apply_chat_template的代碼片段，展示瞭如何加載分詞器和模型並生成內容：

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "prithivMLmods/Theta-Lyrae-Qwen-14B"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype="auto",
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "What are the key principles of general-purpose AI?"
messages = [
    {"role": "system", "content": "You are a helpful assistant capable of answering a wide range of questions."},
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]