Llama-3.1-Nemotron-Nano-4B-v1.1オープンソース言語モデル - ローカルの単一GPUで実行可能、推論とタスク実行がより効率的

ホーム

Llama 3.1 Nemotron Nano 4B V1.1

unslothによって開発

Llama-3.1-Nemotron-Nano-4B-v1.1はLlama 3.1 8Bを圧縮した大規模言語モデルで、推論能力とタスク実行効率を最適化し、単一のRTXグラフィックカードでのローカル実行に適しています。

大規模言語モデル

Transformers

英語オープンソースライセンス:その他 #推論最適化 #ツール呼び出し #シングルGPUデプロイ

ダウンロード数 219

リリース時間 : 5/21/2025

モデル概要

このモデルは、数学、コード、推論、ツール呼び出しの教師あり微調整、および対話と指示追従の強化学習を含む多段階の後訓練プロセスにより、推論能力と非推論能力を強化しています。

モデル特徴

効率的な推論

LLM圧縮技術により最適化され、単一のRTXグラフィックカードに適応し、ローカル実行をサポートします。

多段階トレーニング

教師あり微調整（SFT）と強化学習（RL）を組み合わせ、数学、コード、推論、対話タスクにおけるモデルのパフォーマンスを向上させます。

長文コンテキストサポート

最大131,072トークンのコンテキスト長をサポートし、長文タスクの処理に適しています。

ツール呼び出しサポート

組み込みのツール呼び出しパーサーにより、動的なツール選択と実行をサポートします。

モデル能力

テキスト生成

数学的推論

コード生成

ツール呼び出し

多言語サポート

指示追従

使用事例

AIエージェントシステム

チャットボット

効率的な対話システムの構築に使用され、自然言語インタラクションをサポートします。

MT-Benchベンチマークでスコア8.0（推論有効モード）。

RAGシステム

検索拡張生成タスクをサポートし、知識集約型アプリケーションに適しています。

教育

数学問題解決

方程式の求解や証明などの複雑な数学問題を解決します。

MATH500ベンチマークでpass@1が96.2%（推論有効モード）。

開発ツール

コード生成

自然言語の記述に基づいて実行可能なPythonコードを生成します。

MBPP 0-shotベンチマークでpass@1が85.8%（推論有効モード）。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご