C

Caplattessdolxaboros Yi 34B 200K DARE Ties HighDensity

brucethemooseによって開発
これはYi-34B-200Kベースモデルを基に、DARE Tiesメソッドで複数の同系モデルを高密度マージしたモデルで、200Kの長文コンテキスト処理能力を有します。
ダウンロード数 94
リリース時間 : 12/9/2023

モデル概要

このモデルはmergekitのDARE Tiesメソッドを用いて、Dolphin-2.2-yi-34b-200k、Nous-Capybara-34B、Tess-M-v1.4などの同系モデルをマージし、Yi-34B-200Kの長文コンテキスト能力を保持しながら、複数のベンチマークテストで優れた性能を示します。

モデル特徴

長文コンテキスト処理
200Kトークンの長文コンテキスト処理をサポートし、長文ドキュメントや複雑な推論タスクに適しています
高密度マージ
DARE Tiesメソッドを使用して推奨密度以上の同系モデルをマージし、モデル性能を向上させています
マルチモデル強み融合
Dolphin、Capybara、Tessなど複数モデルの強みを統合し、多様な能力を備えています
効率的な推論
24GB GPUで動作可能で、exllamav2上では45K-75Kのコンテキスト長をサポートします

モデル能力

テキスト生成
長文理解
複雑な推論
質問応答システム
知識質問応答

使用事例

知識質問応答
AI2推論チャレンジ
AI2推論チャレンジ(ARC)における少数サンプルでのパフォーマンス
標準化正解率67.41
常識推論
HellaSwagテスト
HellaSwagデータセットにおける常識推論能力
標準化正解率85.77
数学推論
GSM8k数学問題
小学校レベルの数学文章題を解く能力
正解率61.33
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase