Llama4Some-SOVL-4x8B-L3-V1オープンソース言語モデル - 無料でデプロイし、制限のないテキスト生成を実現

ホーム

Llama4some SOVL 4x8B L3 V1

saishfによって開発

これはmergekitを使用して複数の事前学習済み言語モデルを統合して得られたエキスパート混合モデルで、最も制約のないテキスト生成能力を創造することを目的としています。

大規模言語モデル

Transformers

#エキスパート混合モデル #マルチタスクテキスト生成 #高い推論能力

ダウンロード数 22

リリース時間 : 5/12/2024

モデル概要

このモデルは複数のSOVLシリーズモデルを統合し、Mixtralスタイルのエキスパート混合手法を採用し、自由で制約のないテキスト生成タスクに焦点を当てています。

モデル特徴

エキスパート混合アーキテクチャ

ランダムゲート方式のエキスパート混合手法を採用し、複数モデルの強みを統合

制約のない生成

自由で創造的なテキスト生成に特化して設計

マルチモデル融合

4つの異なる8Bパラメータモデルの強みを統合

モデル能力

テキスト生成

オープンドメイン対話

推論タスク処理

使用事例

クリエイティブライティング

自由創作

創造性豊かなストーリーやコンテンツを生成

予想外の創造的な出力が得られる可能性

オープンドメイン対話

非公式チャット

自由形式の会話交流を行う

非伝統的だが興味深い応答が得られる可能性

メトリック	値
平均	66.76
AI2 Reasoning Challenge (25-Shot)	61.95
HellaSwag (10-Shot)	79.38
MMLU (5-Shot)	65.49
TruthfulQA (0-shot)	51.48
Winogrande (5-shot)	75.69
GSM8k (5-shot)	66.57

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Llama4some SOVL 4x8B L3 V1

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Llama4Some-SOVL-4x8B-L3-V1

🚀 クイックスタート

✨ 主な機能

📚 ドキュメント

🔍 マージの詳細

マージ方法

マージに使用されたモデル

設定

🔍 Open LLM Leaderboardの評価結果

📄 ライセンス