B

Bitnet B1.58 2B 4T Gguf

microsoftによって開発
マイクロソフトリサーチが開発した初のオープンソース、ネイティブ1ビットの大規模言語モデルで、パラメータ規模は20億、4兆トークンのコーパスでトレーニングされています。
ダウンロード数 25.77k
リリース時間 : 4/15/2025

モデル概要

BitNet b1.58 2B4Tはネイティブ1ビットの大規模言語モデルで、ネイティブ1ビットの大規模言語モデルが類似規模の主流オープンウェイト、フル精度モデルと同等の性能を達成可能であることを証明し、計算効率(メモリ、消費電力、レイテンシ)において顕著な優位性を持っています。

モデル特徴

ネイティブ1.58ビット量子化
重みは絶対値平均で三元値{-1, 0, +1}に量子化され、活性化は絶対値最大値で8ビット整数(トークン単位)に量子化されます。
効率的な計算
計算効率(メモリ、消費電力、レイテンシ)において顕著な優位性があり、メモリ使用量はわずか0.4GB、レイテンシは29ms(CPUデコード)まで低減されています。
大規模トレーニング
4兆トークンのコーパスでトレーニングされており、ネイティブ1ビットの大規模言語モデルが類似規模の主流オープンウェイト、フル精度モデルと同等の性能を達成可能であることを証明しています。
長文脈サポート
最大シーケンス長は4096トークンで、長文脈タスクをサポートしています。

モデル能力

テキスト生成
チャット対話
指示追従
数学的推論
常識的質問応答

使用事例

対話システム
AIアシスタント
AIアシスタントとして対話し、ユーザーの質問に答えます。
流暢で一貫性のある対話応答を生成できます。
教育
数学問題解答
GSM8KやMATH-500などの数学的推論タスクを含む数学問題を解答します。
GSM8KやMATH-500などの数学的推論タスクで優れた性能を発揮します。
質問応答システム
常識的質問応答
ARCチャレンジやOpenbookQAなどの常識的な質問に答えます。
ARCチャレンジやOpenbookQAなどのタスクで良好な性能を示します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase