Air - Striker - MixtralオープンソースAIモデル - 8Kコンテキストをサポート、ChatML形式での交流が可能

ホーム

Air Striker Mixtral 8x7B Instruct ZLoss 3.75bpw H6 Exl2

LoneStrikerによって開発

Mixtral-8x7B-v0.1をファインチューニングしマージした実験的モデル、8Kコンテキスト長をサポート、ChatMLプロンプト形式を採用

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #8K長文生成 #ChatML命令ファインチューニング #混合専門家アーキテクチャ

ダウンロード数 49

リリース時間 : 1/12/2024

モデル概要

このモデルはMixtral-8x7B-v0.1をファインチューニングし、airoboros-3.2データセットで訓練後、Mixtral-8x7B-Instruct-v0.1とマージされたもので、テキスト生成タスクに適しています

モデル特徴

ハイブリッドモデル

ファインチューニングされたMixtral-8x7BとオリジナルInstructバージョンの利点を組み合わせた

長文コンテキストサポート

8K長のコンテキスト処理をサポート

ChatML形式

ChatMLプロンプト形式を使用、対話シナリオに適している

モデル能力

テキスト生成

対話システム

命令追従

使用事例

対話システム

インテリジェントアシスタント

インテリジェントな対話アシスタントとして使用可能

コンテンツ生成

クリエイティブライティング

ストーリーや詩などのクリエイティブなコンテンツを生成

Property	Details
Inference	false
Language	en
Library Name	transformers
Pipeline Tag	text-generation
Tags	mixtral, mergekit, merge
License	apache-2.0
Datasets	jondurbin/airoboros-3.2

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Air Striker Mixtral 8x7B Instruct ZLoss 3.75bpw H6 Exl2

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Air-Striker-Mixtral-8x7B-Instruct-ZLoss

📚 ドキュメント

🔧 マージの詳細

マージ方法

マージされたモデル

設定

📄 ライセンス