V

Virtuoso Medium V2

arcee-aiによって開発
Qwen-2.5-32Bアーキテクチャに基づく320億パラメータ言語モデル。Deepseek-v3蒸留トレーニングにより、複数のベンチマークテストで優れた性能を発揮。
ダウンロード数 412
リリース時間 : 1/27/2025

モデル概要

次世代320億パラメータ言語モデル。Deepseek-v3からlogitレベル蒸留で知識を取得し、高度な自然言語処理タスクに適応。

モデル特徴

深度蒸留技術
logitレベル蒸留でDeepseek-v3から数十億トークンの知識を抽出し、高忠実度な知識伝達を保証
クロスアーキテクチャトークナイザ互換
専用の'トークナイザ手術'によりDeepseek-v3とQwenトークナイザのシームレスな整合を実現
拡張推論能力
科学技術クエリ、コード生成、数学問題解決などの専門分野における推論能力を特別強化
融合統合手法
独自技術でlogitレベル蒸留を実施し、教師モデルの専門性を最大限保持

モデル能力

高度なテキスト生成
複雑な論理推論
マルチターン対話処理
科学技術文献理解
プログラミングコード生成
数学問題解決
多言語処理

使用事例

インテリジェントアシスタント
企業向け仮想アシスタント
複雑なワークフロー照会やデータ分析タスクを処理
内部テストで前世代モデルを30%上回るタスク達成率
教育テクノロジー
STEM教育支援
複雑な科学概念の説明や数学問題解決
MMLU-PROベンチマークでトップレベルを達成
研究支援
文献分析とシミュレーション
研究論文の迅速理解とシミュレーション仮説生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase