G

GRPO VI Qwen2 7B RAG

由AITeamVN開發
基於Qwen2.5-7B-Instruct微調的越南語檢索增強生成(RAG)專用大模型,採用GRPO優化方法訓練
下載量 402
發布時間 : 4/30/2025

模型概述

專為越南語檢索增強生成任務優化的語言模型,具備多跳推理、信息整合等RAG能力,同時保留通用問答和STEM任務處理能力

模型特點

越南語RAG優化
專門針對越南語檢索增強生成任務進行優化,提升多跳推理和信息整合能力
GRPO訓練方法
採用組相對策略優化(GRPO)方法進行訓練,結合監督微調與獎勵模型評分
長上下文支持
支持8192標記的上下文長度,適合處理複雜文檔和長對話場景
STEM能力增強
強化數學與編程相關任務的解決能力

模型能力

多跳推理
負面過濾
信息整合
正負識別
數學問題解答
編程問題解答
通用問答

使用案例

信息檢索與整合
企業信息查詢
從文檔中提取特定企業營收增長信息及支撐因素
準確識別並整合文檔中的相關信息
教育
數學問題解答
解決各類數學方程和問題
提供分步解答過程和最終答案
通用知識問答
地理知識查詢
回答關於越南地理特徵的問題
提供準確的地理知識回答
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase