B

Bitnet B1 58 Xl

Developed by 1bitLLM
BitNet b1.58 3Bは1ビット量子化された大規模言語モデルで、RedPajamaデータセットを使用して1000億トークン訓練され、性能を維持しながら計算リソース要件を大幅に削減しました。
Downloads 10.64k
Release Time : 3/29/2024

Model Overview

このモデルはBitNet b1.58論文の再現実装で、1.58ビット量子化技術を採用し、効率的な言語モデルソリューションを提供することを目的としています。

Model Features

1ビット量子化
1.58ビット量子化技術を採用し、モデルのストレージと計算要件を大幅に削減
効率的なトレーニング
2段階の学習率調整と重み減衰を使用してトレーニングプロセスを最適化
フル精度モデルに近い性能
3Bパラメータ規模で、FP16フル精度モデルに近い性能を発揮

Model Capabilities

テキスト生成
言語理解
ゼロショット学習

Use Cases

自然言語処理
質問応答システム
効率的な質問応答システムの構築に使用可能
ARCなどのベンチマークテストで良好なパフォーマンス
テキスト生成
様々なテキスト生成タスクに適しています
パープレキシティ(PPL)のパフォーマンスがフル精度モデルに近い
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase