Llama 3 3 Nemotron Super 49B V1 GGUF
その他
Llama-3.3-Nemotron-Super-49B-v1 は大規模言語モデルで、Meta Llama-3.3-70B-Instruct を改良し、推論能力、人間とのチャット適性、タスク実行能力を強化し、128Kトークンのコンテキスト長をサポートします。
大規模言語モデル
Transformers 英語

L
unsloth
814
1
Llama 3.1 Nemotron Nano 8B V1 GGUF
その他
Llama-3.1-Nemotron-Nano-8B-v1はMeta Llama-3.1-8B-Instructをベースとした推論モデルで、推論能力、人間のチャット嗜好性、タスク実行能力を強化するための追加トレーニングが施されています。
大規模言語モデル
Transformers 英語

L
unsloth
22.18k
3
Llama 3 1 Nemotron Ultra 253B CPT V1
その他
Llama-3.1-Nemotron-Ultra-253B-CPT-v1はMeta Llama-3.1-405B-Instructを基盤とした大規模言語モデルで、128Kトークンのコンテキスト長をサポートし、ニューラルアーキテクチャサーチによる最適化により、精度と効率性の良好なバランスを実現しています。
大規模言語モデル
Transformers 英語

L
nvidia
155
3
Llama 3 3 Nemotron Super 49B V1
その他
Llama-3.3-Nemotron-Super-49B-v1はMeta Llama-3.3-70B-Instructを基盤とした大規模言語モデルで、推論、対話選好、タスク実行に特化し、128Kトークンのコンテキスト長をサポートします。
大規模言語モデル
Transformers 英語

L
nvidia
150.65k
270
Deepseek R1
MIT
DeepSeek-R1は深度求索が開発した第一世代推論モデルで、大規模な強化学習トレーニングにより、数学、コード、推論タスクで優れた性能を発揮します。
大規模言語モデル
Transformers

D
deepseek-ai
1.7M
12.03k
Glm 4 9b Chat Hf
その他
GLM-4-9Bは智譜AIが発表したGLM-4シリーズの最新世代事前学習モデルのオープンソース版で、優れた意味理解、数学、推論、コード、知識能力を備えています。
大規模言語モデル
Transformers 複数言語対応

G
THUDM
7,919
13
Phi 3.5 Mini Instruct
MIT
Phi-3.5-miniは、軽量で最先端のオープンソースモデルであり、Phi-3で使用されたデータセットに基づいて構築され、128Kのコンテキスト長をサポートし、高品質で推論能力に富んだデータを特に重視しています。
大規模言語モデル
Transformers その他

P
microsoft
354.64k
859
Glm 4 9b
その他
GLM-4-9Bは智譜AIが発表した最新のオープンソース事前学習モデルで、複数のベンチマークテストにおいてLlama-3-8Bを上回り、128Kのコンテキスト長と26言語をサポートしています。
大規模言語モデル
Transformers 複数言語対応

G
THUDM
9,944
132
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98