Distilbert Base Uncased Distilled Squad Int8 Static Inc
これはDistilBERTベース未エンコードモデルのINT8量子化バージョンで、質問応答タスク向けに設計されており、学習後静的量子化によりモデルサイズと推論速度が最適化されています。
ダウンロード数 1,737
リリース時間 : 8/4/2022
モデル概要
このモデルはDistilBERTベース未エンコードモデルのINT8量子化バージョンで、スタンフォード質問応答データセット(SQuAD)でファインチューニングされています。量子化プロセスではHugging FaceのOptimum-Intelツールとインテル® ニューラル・コンプレッサー技術を使用し、高い精度を維持しながらモデルサイズと推論遅延を大幅に削減することを目的としています。
モデル特徴
INT8量子化
学習後静的量子化によりモデルをFP32精度からINT8に変換し、モデルサイズと推論遅延を大幅に削減します。
効率的な推論
最適化されたモデルは計算リソースが限られた環境での展開に適しており、低遅延の質問応答能力を提供します。
高い精度の維持
量子化プロセスで可能な限り元のモデルの精度を維持し、質問応答タスクの効率的な実行を保証します。
モデル能力
質問応答タスク
テキスト理解
コンテキスト分析
使用事例
質問応答システム
コンテキストに基づく質問応答
与えられたコンテキスト段落に基づいて質問に答えることができ、ナレッジベース検索やカスタマーサポートシステムなどのシナリオに適しています。
F1スコア:86.1069(INT8 PyTorchバージョン)
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98