K

Keyphrase Extraction Kbir Inspec

ml6teamによって開発
KBIR事前学習モデルをInspecデータセットでファインチューニングしたキーワード抽出モデルで、シーケンスラベリング手法を用いてテキスト中のキーワード群を識別します。
ダウンロード数 22.12k
リリース時間 : 3/29/2022

モデル概要

このモデルはTransformerアーキテクチャによりキーワード抽出タスクをトークン分類問題としてモデル化し、英語の科学論文要約から正確にキーワードを抽出できます。

モデル特徴

マルチタスク事前学習フレームワーク
マスク言語モデリング(MLM)、キーワード境界埋め込み(KBI)、キーワード置換分類(KRC)を組み合わせた共同最適化
シーケンスラベリング手法
キーワード抽出をBIOタグシーケンス予測問題に変換し、キーワード群の境界情報を捕捉
ドメイン特化
コンピュータサイエンス分野のInspec論文データセットでファインチューニングされており、学術テキスト分析に適している

モデル能力

英語キーワード抽出
学術テキストの意味解析
長距離文脈依存性の捕捉

使用事例

学術研究
論文要約のキーワード自動索引付け
科学論文要約から核心用語を自動抽出し、手動索引付けを代替
F1@Mが0.564に達し、従来手法より効率が大幅向上
情報検索
学術文献索引構築
文献データベース向けに標準化されたキーワード索引を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase