B

Bitnet B1.58 2B 4T Bf16

Developed by microsoft
マイクロソフトリサーチによって開発されたオープンソースのネイティブ1ビット大規模言語モデルで、パラメータ規模は20億、4兆トークンのコーパスでトレーニングされ、計算効率が大幅に向上しています。
Downloads 2,968
Release Time : 4/15/2025

Model Overview

初のオープンソースで、パラメータ規模が20億のネイティブ1ビット大規模言語モデルで、ネイティブ1ビット大規模言語モデルが同等の全精度モデルと同等の性能を維持しながら、計算効率(メモリ、消費電力、遅延)を大幅に向上できることを証明しています。

Model Features

ネイティブ1.58ビット量子化
重みはフォワード伝播時に絶対値平均によって三元値{-1, 0, +1}に量子化され、活性化は絶対値最大値によって8ビット整数に量子化されます。
効率的な計算
計算効率(メモリ、消費電力、遅延)が大幅に向上し、メモリ使用量はわずか0.4GB、遅延は29ms(CPUデコード)、消費電力は0.028Jと推定されます。
大規模トレーニング
4兆トークンのコーパスでトレーニングされ、ネイティブ1ビット大規模言語モデルの実現可能性を証明しています。
最適化されたアーキテクチャ
BitLinear層、回転位置エンコーディング(RoPE)、平方ReLU(ReLU²)活性化、subln正規化を採用し、線形層と正規化層にはバイアス項がありません。

Model Capabilities

テキスト生成
チャット
指示に従う
数学的推論
常識質問応答

Use Cases

対話システム
AIアシスタント
役立つAIアシスタントとして、自然言語対話を行います。
人間評価で38.40点を獲得
教育
数学問題解答
GSM8Kデータセットなどの数学問題を解答します。
GSM8Kで58.38点を獲得
知識質問応答
常識質問応答
常識QAで71.58点を獲得
専門知識質問応答
MMLUで53.17点を獲得
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase