omost-llama-3-8b-4bitsオープンソースモデル - 8kコンテキスト長をサポート、無料で自由に利用可能

ホーム

Omost Llama 3 8b 4bits

lllyasvielによって開発

Omostがリリースしたllama-3モデルで、8kのコンテキスト長をサポートし、nf4量子化を採用しています。

大規模言語モデル

Transformers

#8k長文テキスト #nf4量子化 #効率的な推論

ダウンロード数 1,163

リリース時間 : 5/29/2024

モデル概要

このモデルはllama-3アーキテクチャに基づく大規模言語モデルで、最適化と量子化処理が施されており、テキスト生成や自然言語処理タスクに適しています。

モデル特徴

8k コンテキスト長

より長いコンテキスト入力をサポートし、複雑なタスクの処理に適しています。

nf4 量子化

4ビット量子化技術を採用し、モデルのサイズと計算リソースの要件を削減します。

モデル能力

テキスト生成

自然言語処理

使用事例

テキスト生成

コンテンツ作成

記事、ストーリー、その他のクリエイティブなテキストを生成します。

対話システム

チャットボットや仮想アシスタントの構築に使用されます。

Property	Details
Model Type	omost-llama-3-8b-4bits
Tags	pytorch, trl, sft
Inference	false

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Omost Llama 3 8b 4bits

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Omost-llama-3-8b-4bits

🚀 クイックスタート

モデル情報