Llama3-8B-1.58-100B-tokens-GGUFオープンソースモデル - 推論に適した実用的な選択肢

ホーム

Llama3 8B 1.58 100B Tokens GGUF

brunopioによって開発

Meta-Llama-3-8B-InstructとHF1BitLLM/Llama3-8B-1.58-100B-tokensモデルを基に変換されたGGUF形式のモデルで、llama.cpp推論に適しています。

大規模言語モデル

Transformers

#1.58ビット量子化 #100Bトークン訓練 #GGUF形式推論

ダウンロード数 2,035

リリース時間 : 9/19/2024

モデル概要

これは8Bパラメータ規模の大規模言語モデルで、100Bトークンで訓練され、llama.cppで使用するためにGGUF形式に変換されています。

モデル特徴

GGUF形式

GGUF形式に変換され、llama.cppでの使用体験が最適化されています。

高効率推論

ローカルデプロイと推論に適しており、リソース消費が比較的低いです。

大容量訓練

100Bトークンの訓練データに基づいています。

モデル能力

テキスト生成

対話システム

質問応答システム

コンテンツ作成

使用事例

コンテンツ生成

創作執筆

物語、詩などの創作コンテンツを生成します。

技術文書

技術文書と説明を自動生成します。

対話システム

スマートアシスタント

対話型AIアシスタントを構築します。

🚀 TransformersライブラリのLlama3-8B-1.58モデル

このプロジェクトでは、transformersライブラリを用いて、Meta-Llama社のLlama3-8B-1.58シリーズのモデルを活用します。具体的には、meta-llama/Meta-Llama-3-8B-InstructとHF1BitLLM/Llama3-8B-1.58-100B-tokensの2つのベースモデルがサポートされています。

🚀 クイックスタート

このモデルは、HF1BitLLM/Llama3-8B-1.58-100B-tokens からllama.cppを使用してGGUF形式に変換されました。

📦 インストール

llama.cppをBrewを通じてインストールします（MacとLinuxで動作します）。

brew install llama.cpp

💻 使用例

基本的な使用法

llama.cppのCLIまたはサーバーを起動します。

CLI:

llama-cli --hf-repo brunopio/Llama3-8B-1.58-100B-tokens-GGUF --hf-file Llama3-8B-1.58-100B-tokens-GGUF -p "The meaning to life and the universe is"

サーバー:

llama-server --hf-repo brunopio/Llama3-8B-1.58-100B-tokens-GGUF --hf-file Llama3-8B-1.58-100B-tokens-GGUF -c 2048

高度な使用法

以下の手順に従って、llama.cppを直接使用することもできます。

ステップ1: GitHubからllama.cppをクローンします。

git clone https://github.com/ggerganov/llama.cpp

ステップ2: llama.cppフォルダに移動し、LLAMA_CURL=1フラグと他のハードウェア固有のフラグ（例：LinuxのNvidia GPUの場合はLLAMA_CUDA=1）を使用してビルドします。

cd llama.cpp && LLAMA_CURL=1 make

ステップ3: メインバイナリを通じて推論を実行します。

./llama-cli --hf-repo brunopio/Llama3-8B-1.58-100B-tokens-GGUF --hf-file Llama3-8B-1.58-100B-tokens-GGUF -p "The meaning to life and the universe is"

または

./llama-server --hf-repo brunopio/Llama3-8B-1.58-100B-tokens-GGUF --hf-file Llama3-8B-1.58-100B-tokens-GGUF -c 2048

⚠️ 重要提示

このチェックポイントは、Llama.cppリポジトリに記載されている使用手順を通じて直接使用することもできます。

属性	详情
ライブラリ名	transformers
ベースモデル	meta-llama/Meta-Llama-3-8B-Instruct、HF1BitLLM/Llama3-8B-1.58-100B-tokens

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご