G

GRPO VI Qwen2 7B RAG

AITeamVNによって開発
Qwen2.5-7B-Instructをファインチューニングしたベトナム語検索拡張生成(RAG)専用大規模モデル、GRPO最適化手法でトレーニング
ダウンロード数 402
リリース時間 : 4/30/2025

モデル概要

ベトナム語検索拡張生成タスクに最適化された言語モデルで、マルチホップ推論や情報統合などのRAG能力を備えつつ、一般的なQAやSTEMタスク処理能力も保持

モデル特徴

ベトナム語RAG最適化
ベトナム語検索拡張生成タスクに特化して最適化され、マルチホップ推論と情報統合能力を向上
GRPOトレーニング手法
グループ相対戦略最適化(GRPO)手法を採用し、教師ありファインチューニングと報酬モデルスコアリングを組み合わせ
長文脈サポート
8192トークンの文脈長をサポートし、複雑な文書や長い対話シーンに適応
STEM能力強化
数学とプログラミング関連タスクの解決能力を強化

モデル能力

マルチホップ推論
ネガティブフィルタリング
情報統合
ポジネガ識別
数学問題解答
プログラミング問題解答
一般的なQA

使用事例

情報検索と統合
企業情報検索
文書から特定企業の収益成長情報とその要因を抽出
文書内の関連情報を正確に識別・統合
教育
数学問題解答
様々な数学方程式や問題を解決
ステップバイステップの解答プロセスと最終回答を提供
一般的な知識QA
地理知識検索
ベトナムの地理的特徴に関する質問に回答
正確な地理知識回答を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase