Bert Base Uncased Squad1.1 Block Sparse 0.07 V1
これはSQuAD1.1データセットで微調整されたBERT-base大文字小文字区別なしモデルで、ブロック疎構造を採用し、元の重みの28.2%のみを保持し、評価速度は密集ネットワークより1.92倍速い。
ダウンロード数 209
リリース時間 : 3/2/2022
モデル概要
このモデルは主に質問応答システムのタスクに使用され、与えられた文脈に基づいて関連する質問に回答することができます。モデルは動的剪定技術で最適化され、高い正確率を維持しながら推論速度を向上させています。
モデル特徴
ブロック疎構造
線形層は元の重みの7.5%のみを保持し、全体で28.2%の重みを保持し、モデルのサイズを大幅に削減し、推論速度を向上させます。
効率的な推論
評価速度は密集ネットワークより1.92倍速く、同時に比較的高い正確率を維持します。
アテンションヘッドの最適化
144個のアテンションヘッドのうち106個(73.6%)を削除し、モデル構造を最適化しました。
モデル能力
テキスト質問応答
文脈理解
情報抽出
使用事例
スマート質問応答システム
事実的な質問への回答
提供された文脈に基づいて具体的な事実的な質問に回答する
EM:71.88, F1:81.36
教育アプリケーション
学習支援質問応答
学生が教材内容から迅速に質問の答えを見つけるのを支援する
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98