# 128K長文推論

Llama 3 3 Nemotron Super 49B V1 GGUF
その他
Llama-3.3-Nemotron-Super-49B-v1 は大規模言語モデルで、Meta Llama-3.3-70B-Instruct を改良し、推論能力、人間とのチャット適性、タスク実行能力を強化し、128Kトークンのコンテキスト長をサポートします。
大規模言語モデル Transformers 英語
L
unsloth
814
1
Llama 3.1 Nemotron Nano 8B V1 GGUF
その他
Llama-3.1-Nemotron-Nano-8B-v1はMeta Llama-3.1-8B-Instructをベースとした推論モデルで、推論能力、人間のチャット嗜好性、タスク実行能力を強化するための追加トレーニングが施されています。
大規模言語モデル Transformers 英語
L
unsloth
22.18k
3
Llama 3 1 Nemotron Ultra 253B CPT V1
その他
Llama-3.1-Nemotron-Ultra-253B-CPT-v1はMeta Llama-3.1-405B-Instructを基盤とした大規模言語モデルで、128Kトークンのコンテキスト長をサポートし、ニューラルアーキテクチャサーチによる最適化により、精度と効率性の良好なバランスを実現しています。
大規模言語モデル Transformers 英語
L
nvidia
155
3
Llama 3 3 Nemotron Super 49B V1
その他
Llama-3.3-Nemotron-Super-49B-v1はMeta Llama-3.3-70B-Instructを基盤とした大規模言語モデルで、推論、対話選好、タスク実行に特化し、128Kトークンのコンテキスト長をサポートします。
大規模言語モデル Transformers 英語
L
nvidia
150.65k
270
Deepseek R1
MIT
DeepSeek-R1は深度求索が開発した第一世代推論モデルで、大規模な強化学習トレーニングにより、数学、コード、推論タスクで優れた性能を発揮します。
大規模言語モデル Transformers
D
deepseek-ai
1.7M
12.03k
Glm 4 9b Chat Hf
その他
GLM-4-9Bは智譜AIが発表したGLM-4シリーズの最新世代事前学習モデルのオープンソース版で、優れた意味理解、数学、推論、コード、知識能力を備えています。
大規模言語モデル Transformers 複数言語対応
G
THUDM
7,919
13
Phi 3.5 Mini Instruct
MIT
Phi-3.5-miniは、軽量で最先端のオープンソースモデルであり、Phi-3で使用されたデータセットに基づいて構築され、128Kのコンテキスト長をサポートし、高品質で推論能力に富んだデータを特に重視しています。
大規模言語モデル Transformers その他
P
microsoft
354.64k
859
Glm 4 9b
その他
GLM-4-9Bは智譜AIが発表した最新のオープンソース事前学習モデルで、複数のベンチマークテストにおいてLlama-3-8Bを上回り、128Kのコンテキスト長と26言語をサポートしています。
大規模言語モデル Transformers 複数言語対応
G
THUDM
9,944
132
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase