GLM-Z1-9B-0414-GGUFオープンソーステキストモデル - 中国語と英語の両言語をサポートした多レベル量子化生成

ホーム

GLM Z1 9B 0414 GGUF

Mungertによって開発

GLM-Z1-9B-0414 は中英バイリンガルのテキスト生成モデルで、GGUFフォーマットを採用し、BF16から超低ビット量子化（1-2ビット）までの複数の量子化レベルに対応しています。

大規模言語モデル複数言語対応オープンソースライセンス:MIT #超低ビット量子化 #多言語生成 #エッジコンピューティング最適化

ダウンロード数 1,598

リリース時間 : 4/26/2025

モデル概要

このモデルはGLMアーキテクチャに基づいており、中英バイリンガルのテキスト生成タスクをサポートし、CPUやGPUを含むさまざまなハードウェア環境に適しています。

モデル特徴

IQ-DynamicGate 超低ビット量子化

1-2ビットの超低ビット量子化をサポートし、動的精度割り当てと主要コンポーネント保護により、メモリ効率を維持しながら精度を向上させます。

多量子化レベルサポート

BF16、F16からQ4_K、Q6_K、Q8_0など、さまざまな量子化レベルを提供し、異なるハードウェア要件に対応します。

中英バイリンガルサポート

モデルは中国語と英語のテキスト生成タスクをサポートしています。

モデル能力

テキスト生成

中英バイリンガル処理

低メモリ推論

使用事例

メモリ制約のある展開

エッジデバイス推論

メモリが限られたエッジデバイスでテキスト生成タスクを実行します。

超低ビット量子化（IQ3_XSなど）により、極限のメモリ効率を実現します。

研究

超低ビット量子化研究

1-2ビット量子化がモデル性能に与える影響を研究します。

さまざまな量子化レベルのベンチマークデータを提供します。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

GLM Z1 9B 0414 GGUF

モデル概要

モデル特徴

モデル能力

使用事例

GLM-Z1-9B-0414 GGUF モデル

モデル生成詳細