N

Ner Stacked Bert Multilingual Light

impresso-projectによって開発
Impresso NERモデルは、歴史文書処理用の多言語命名エンティティ認識モデルで、スタック型Transformerアーキテクチャに基づいており、デジタル化された歴史テキスト中の細粒度および粗粒度のエンティティタイプを認識できます。
ダウンロード数 1,009
リリース時間 : 5/16/2025

モデル概要

このモデルは、歴史文書中の命名エンティティ(人物、組織、場所、時間、製品など)を認識することを目的としており、特にOCR転写された歴史新聞の内容の処理に適しています。

モデル特徴

多言語対応
フランス語、ドイツ語、英語をサポートし、多言語の歴史テキスト処理に適しています。
細粒度および粗粒度のエンティティ認識
人物、組織、製品、時間、場所などの多種のエンティティタイプを認識できます。
OCRノイズ耐性
Transformer層をスタックすることで、歴史文書中のOCRノイズ、スペルの変化、非標準的な言語用法の影響を効果的に軽減します。

モデル能力

歴史テキストの命名エンティティ認識
多言語エンティティ認識
細粒度エンティティ分類
OCRノイズ耐性処理

使用事例

歴史情報抽出
歴史アーカイブ分析
歴史新聞やアーカイブから人物、場所、時間などのエンティティ情報を抽出します。
歴史イベントのタイムラインや人物関係ネットワークの再構築に利用できます。
伝記再構築
人物生涯研究
歴史文書から人物の名前、肩書き、職務などの情報を抽出します。
歴史人物の詳細な伝記資料の構築に役立ちます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase