モデル選定

強化学習微調整

# 強化学習微調整

Vigorl 7b Spatial

ViGoRLは、強化学習によって微調整された視覚言語モデルで、テキストの推論ステップを視覚座標と明確に関連付け、正確な視覚推論と定位を実現します。

テキスト生成画像

Deepseek R1 Distill Qwen 14B GRPO Taiwan Spirit

これはQwen-14Bモデルをベースに微調整されたバージョンで、GRPO方法を用いて訓練され、テキスト生成タスクに適しています。

大規模言語モデル

Codev R1 Qwen 7B

CodeV - R1 - Qwen - 7BはCodeV - R1フレームワークに基づき、Qwen/Qwen2.5 - Coder - 7B - Instructを基に強化学習微調整を行って得られたモデルで、Verilog関連のタスクに特化しており、電子設計自動化におけるハードウェア記述言語の自動生成の難題を効果的に解決できます。

大規模言語モデル

Deductive Reasoning Qwen 32B

Qwen 2.5 32B Instructを基に強化学習微調整で訓練されたモデルで、Temporal Clueデータセットの挑戦的な演繹推論問題を解決するために特別に設計されています。

大規模言語モデル

Transformers 英語

Codellama 7b Hf ReFT GSM8k

強化学習による微調整で大規模言語モデルの推論汎化能力を強化、Codellamaをベースに微調整され、コード生成と理解タスクに適しています。

大規模言語モデル

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase