D

Distilbert Base Uncased Distilled Squad Int8 Static Inc

Intelによって開発
これはDistilBERTベース未エンコードモデルのINT8量子化バージョンで、質問応答タスク向けに設計されており、学習後静的量子化によりモデルサイズと推論速度が最適化されています。
ダウンロード数 1,737
リリース時間 : 8/4/2022

モデル概要

このモデルはDistilBERTベース未エンコードモデルのINT8量子化バージョンで、スタンフォード質問応答データセット(SQuAD)でファインチューニングされています。量子化プロセスではHugging FaceのOptimum-Intelツールとインテル® ニューラル・コンプレッサー技術を使用し、高い精度を維持しながらモデルサイズと推論遅延を大幅に削減することを目的としています。

モデル特徴

INT8量子化
学習後静的量子化によりモデルをFP32精度からINT8に変換し、モデルサイズと推論遅延を大幅に削減します。
効率的な推論
最適化されたモデルは計算リソースが限られた環境での展開に適しており、低遅延の質問応答能力を提供します。
高い精度の維持
量子化プロセスで可能な限り元のモデルの精度を維持し、質問応答タスクの効率的な実行を保証します。

モデル能力

質問応答タスク
テキスト理解
コンテキスト分析

使用事例

質問応答システム
コンテキストに基づく質問応答
与えられたコンテキスト段落に基づいて質問に答えることができ、ナレッジベース検索やカスタマーサポートシステムなどのシナリオに適しています。
F1スコア:86.1069(INT8 PyTorchバージョン)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase