B

Bitnet B1.58 2B 4T Bf16

microsoftによって開発
マイクロソフトリサーチによって開発されたオープンソースのネイティブ1ビット大規模言語モデルで、パラメータ規模は20億、4兆トークンのコーパスでトレーニングされ、計算効率が大幅に向上しています。
ダウンロード数 2,968
リリース時間 : 4/15/2025

モデル概要

初のオープンソースで、パラメータ規模が20億のネイティブ1ビット大規模言語モデルで、ネイティブ1ビット大規模言語モデルが同等の全精度モデルと同等の性能を維持しながら、計算効率(メモリ、消費電力、遅延)を大幅に向上できることを証明しています。

モデル特徴

ネイティブ1.58ビット量子化
重みはフォワード伝播時に絶対値平均によって三元値{-1, 0, +1}に量子化され、活性化は絶対値最大値によって8ビット整数に量子化されます。
効率的な計算
計算効率(メモリ、消費電力、遅延)が大幅に向上し、メモリ使用量はわずか0.4GB、遅延は29ms(CPUデコード)、消費電力は0.028Jと推定されます。
大規模トレーニング
4兆トークンのコーパスでトレーニングされ、ネイティブ1ビット大規模言語モデルの実現可能性を証明しています。
最適化されたアーキテクチャ
BitLinear層、回転位置エンコーディング(RoPE)、平方ReLU(ReLU²)活性化、subln正規化を採用し、線形層と正規化層にはバイアス項がありません。

モデル能力

テキスト生成
チャット
指示に従う
数学的推論
常識質問応答

使用事例

対話システム
AIアシスタント
役立つAIアシスタントとして、自然言語対話を行います。
人間評価で38.40点を獲得
教育
数学問題解答
GSM8Kデータセットなどの数学問題を解答します。
GSM8Kで58.38点を獲得
知識質問応答
常識質問応答
常識QAで71.58点を獲得
専門知識質問応答
MMLUで53.17点を獲得
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase