オープンソースで無料のmagnum-v1-72bモデル - Claude 3の散文レベルの質の高い執筆を再現するために欠かせない存在

ホーム

Magnum V1 72b

anthracite-orgによって開発

Qwen-2 72B Instructをファインチューニングしたモデルで、Claude 3モデルの散文品質を再現することを目的としています

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:その他 #72B大規模モデル #マルチターン対話最適化 #ゼロショット学習

ダウンロード数 60

リリース時間 : 6/17/2024

モデル概要

このモデルはQwen-2 72B Instructをベースにファインチューニングされた大規模言語モデルで、特に散文スタイルのテキスト生成品質向上に焦点を当てています。Claude 3モデル（特にSonnetとOpus）の散文品質を再現することを目的としたシリーズ最初のバージョンです。

モデル特徴

高品質散文生成

散文スタイルのテキスト生成に特化して最適化され、Claude 3モデルの散文品質を再現することを目指しています

多言語サポート

英語と中国語の2言語でのテキスト生成をサポート

大規模トレーニング

5500万の高品質ロールプレイデータトークンを使用してトレーニング

モデル能力

テキスト生成

多言語テキスト処理

散文スタイルライティング

使用事例

コンテンツ作成

散文創作

高品質な散文スタイルのテキストを生成

Claude 3モデルに近い散文品質

ロールプレイ対話

トレーニングデータ内のロールプレイトークンに基づき、キャラクター対話を生成可能

指標	値
平均	42.17
IFEval (0-Shot)	76.06
BBH (3-Shot)	57.65
MATH Lvl 5 (4-Shot)	35.27
GPQA (0-shot)	18.79
MuSR (0-shot)	15.62
MMLU-PRO (5-shot)	49.64

指標	値
平均	42.21
IFEval (0-Shot)	76.06
BBH (3-Shot)	57.65
MATH Lvl 5 (4-Shot)	35.27
GPQA (0-shot)	18.79
MuSR (0-shot)	15.62
MMLU-PRO (5-shot)	49.85

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Magnum V1 72b

モデル概要

モデル特徴

モデル能力

使用事例

🚀 magnum-72b-v1

🚀 クイックスタート

✨ 主な機能

🔧 技術詳細

トレーニング

評価結果

評価結果1

評価結果2

📄 ライセンス

Credits

Safety