R

R1 Aqa

mispeechによって開発
R1-AQAはQwen2-Audio-7B-Instructを基にした音声質問応答モデルで、集団相対戦略最適化(GRPO)アルゴリズムによる強化学習最適化を行い、MMAUベンチマークテストで最先端の性能を達成しました。
ダウンロード数 791
リリース時間 : 3/13/2025

モデル概要

R1-AQAは音声質問応答(AQA)タスク専用のモデルで、強化学習による最適化により、少量のトレーニングデータでも高性能を実現します。

モデル特徴

強化学習最適化
集団相対戦略最適化(GRPO)アルゴリズムを使用して最適化し、性能を大幅に向上させました。
少数サンプル効率的学習
わずか38kのトレーニングサンプルで教師あり微調整の効果を上回り、小規模データセットにおける強化学習の優位性を示しました。
高性能音声質問応答
MMAUベンチマークテストで最先端の性能を達成し、複数の大規模モデルを上回りました。

モデル能力

音声質問応答
音声内容理解
多肢選択問題回答

使用事例

スマートアシスタント
音声内容分析
音声内容を分析し、話者の性別識別などの関連質問に回答します。
MMAUテストで69.76%の高い精度を達成
教育
音声学習支援
学生が音声教材を理解し質問に回答するのを支援します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase