B

Bert Base Uncased Squad1.1 Block Sparse 0.07 V1

madlagによって開発
これはSQuAD1.1データセットで微調整されたBERT-base大文字小文字区別なしモデルで、ブロック疎構造を採用し、元の重みの28.2%のみを保持し、評価速度は密集ネットワークより1.92倍速い。
ダウンロード数 209
リリース時間 : 3/2/2022

モデル概要

このモデルは主に質問応答システムのタスクに使用され、与えられた文脈に基づいて関連する質問に回答することができます。モデルは動的剪定技術で最適化され、高い正確率を維持しながら推論速度を向上させています。

モデル特徴

ブロック疎構造
線形層は元の重みの7.5%のみを保持し、全体で28.2%の重みを保持し、モデルのサイズを大幅に削減し、推論速度を向上させます。
効率的な推論
評価速度は密集ネットワークより1.92倍速く、同時に比較的高い正確率を維持します。
アテンションヘッドの最適化
144個のアテンションヘッドのうち106個(73.6%)を削除し、モデル構造を最適化しました。

モデル能力

テキスト質問応答
文脈理解
情報抽出

使用事例

スマート質問応答システム
事実的な質問への回答
提供された文脈に基づいて具体的な事実的な質問に回答する
EM:71.88, F1:81.36
教育アプリケーション
学習支援質問応答
学生が教材内容から迅速に質問の答えを見つけるのを支援する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase