L

Longformer Base 4096 Finetuned Squadv2

mrm8488によって開発
このモデルはLongformerアーキテクチャに基づき、SQuAD v2 Q&AデータセットでファインチューニングされたQ&Aシステムで、長文シーケンス(最大4096トークン)の処理をサポートします。
ダウンロード数 190
リリース時間 : 3/2/2022

モデル概要

Longformer-base-4096は長文ドキュメント向けに設計されたTransformerモデルで、RoBERTaを初期化し、SQuAD v2データセットでQ&Aタスクのファインチューニングを行いました。スライディングウィンドウのローカルアテンションとグローバルアテンション機構を組み合わせ、長文ドキュメントのQ&Aタスクに適しています。

モデル特徴

長文処理能力
最大4096トークンのシーケンスをサポートし、長文ドキュメントのQ&Aタスクに適しています
混合アテンション機構
スライディングウィンドウのローカルアテンションとグローバルアテンションを組み合わせ、効率を保ちつつ長距離依存関係を捕捉します
高精度Q&A
SQuAD v2検証セットで79.92%の正確一致率と83.35%のF1スコアを達成しました

モデル能力

長文Q&A
オープンドメインQ&A
無回答検出

使用事例

ドキュメントQ&Aシステム
法律文書分析
長い法律文書から特定の質問の答えを抽出します
研究報告Q&A
学術論文や技術報告書に関する質問に答えます
カスタマーサポート
FAQ自動回答
長い製品ドキュメントから顧客の質問に答えます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase