Q

Qwenlong L1 32B

由Tongyi-Zhiwen開發
QwenLong-L1是基於強化學習訓練的長上下文大推理模型,在七個長上下文文檔問答基準測試中表現優異。
下載量 683
發布時間 : 5/23/2025

模型概述

QwenLong-L1是一個通過強化學習訓練的長上下文大推理模型,專注於處理長文檔問答任務,具有強大的推理能力和上下文理解能力。

模型特點

強化學習訓練
採用強化學習框架訓練,包含預熱監督微調、課程引導RL階段和難度感知的回顧採樣機制。
長上下文處理
支持高達131,072個token的上下文長度,通過YaRN方法實現RoPE縮放。
多領域推理能力
在數學推理、邏輯推理和多跳推理等多個領域表現出色。

模型能力

長文本理解
複雜推理
多跳問答
數學推理
邏輯分析

使用案例

文檔問答
財務報告分析
從長篇財務報告中提取關鍵信息並回答相關問題。
在DocMath基準測試中表現優異。
法律文檔理解
解析複雜的法律文檔並回答相關問題。
在法律領域的邏輯推理任務中表現良好。
多跳推理
跨文檔信息整合
從多個相關文檔中整合信息回答複雜問題。
在MultiHopRAG和Musique數據集上表現良好。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase