モデル選定

128k超長コンテキスト

# 128k超長コンテキスト

Qwen3 128k 30B A3B NEO MAX Imatrix Gguf

Qwen3-30B-A3B混合専門家モデルのGGUF量子化バージョンで、コンテキストを128kに拡張し、NEO Imatrix量子化技術を採用して最適化され、多言語および多タスク処理をサポートします。

大規模言語モデル複数言語対応

Qwen3 32B 128k NEO Imatrix Max GGUF

これはQwen3-32BモデルのNEO Imatrix量子化バージョンで、BF16フォーマットを使用して出力テンソルを最大化し、推論/生成能力を向上させ、128kのコンテキスト長をサポートします。

大規模言語モデル

Qwen3 32B 128k HORROR Imatrix Max GGUF

Qwen3-32Bをベースに最適化されたホラーテーマのテキスト生成モデル。Imatrix量子化技術で推論能力を強化し、128kの超長コンテキストをサポート

大規模言語モデル

Mistral Small 3.1 24B Instruct 2503 MAX NEO Imatrix GGUF

Mistralaiが提供する24Bパラメータの命令微調整モデルで、128kのコンテキスト長と多言語処理をサポートし、Neo Imatrix技術とMAX量子化スキームにより性能を向上

大規模言語モデル複数言語対応

Gemma 3 12b It MAX HORROR Imatrix GGUF

GoogleのGemma-3モデルを基にしたホラースタイルの命令微調整バージョン、Neo Imatrix技術と究極の量子化スキームを採用、128kコンテキスト長をサポート

大規模言語モデル

Llama 3.3 70b Instruct Awq

Llama 3.3はMetaが開発した多言語大規模言語モデルで、700億のパラメータを持ち、多言語対話ユースケースに最適化されており、多くのベンチマークテストで優れた性能を発揮します。

大規模言語モデル

Transformers 複数言語対応

Llama 3.2 3B Instruct NEO SI FI GGUF

Llama-3.2アーキテクチャに基づく3Bパラメータの命令微調整モデルで、NEO IMATRIX SFデータセットを統合し、128kの長いコンテキスト生成をサポート

大規模言語モデル複数言語対応

Llama 3.1 405B Instruct FP8

Meta Llama 3.1は多言語大規模言語モデルシリーズで、8B、70B、405B規模の事前学習および命令調整生成モデルを含みます。405Bバージョンは多言語対話シナリオ向けに最適化されており、一般的な業界ベンチマークテストで優れた性能を発揮します。

大規模言語モデル

Transformers 複数言語対応

Llama 3.1 70B Instruct

Meta Llama 3.1 は80億、700億、4050億パラメータを含む事前学習及び命令調整生成モデル群で、多言語対話シーン向けに最適化され、8言語とコード生成をサポートします。

大規模言語モデル

Transformers 複数言語対応

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase