finance-ner-v0.0.8-finetuned-nerオープンソースモデル - 金融テキストの命名エンティティを高精度で識別

ホーム

Finance Ner V0.0.8 Finetuned Ner

AhmedTaha012によって開発

このモデルは金融分野のデータセットで微調整された命名エンティティ認識モデルで、金融テキスト中の命名エンティティを正確に認識できます。

シーケンスラベリング

Transformers

オープンソースライセンス:MIT #金融エンティティ認識 #高精度NER #BERT微調整

ダウンロード数 116

リリース時間 : 8/22/2023

モデル概要

dslim/bert-base-NERをベースに微調整された金融分野の命名エンティティ認識モデルで、金融情報処理に最適化されています。

モデル特徴

高精度認識

評価セットでほぼ完璧な正解率（1.0000）と極低い損失（0.0001）を達成しました。

多指標優秀

適合率0.9994、再現率0.9997、F1スコア0.9995と、各指標が優れた結果を示しました。

金融分野最適化

金融テキストに特化して微調整されており、金融情報処理シーンに適しています。

モデル能力

金融テキストエンティティ認識

命名エンティティ分類

使用事例

金融情報処理

金融ニュース分析

金融ニュースから会社名、人名、金融商品などのエンティティを抽出します。

高い正解率で金融関連のエンティティを認識します。

財務報告処理

財務報告中の重要なエンティティ情報を自動的に認識します。

財務データ関連のエンティティを迅速かつ正確に抽出します。

🚀 finance-ner-v0.0.8-finetuned-ner

このモデルは、Noneデータセットでdslim/bert-base-NERをファインチューニングしたバージョンです。評価セットで優れた成績を収め、金融分野の命名エンティティを正確に識別でき、金融情報処理に効率的かつ正確な解決策を提供します。

🚀 クイックスタート

このモデルは、Hugging Faceプラットフォームで直接使用できます。以下のコードを使ってモデルをロードして使用できます。

from transformers import AutoModelForTokenClassification, AutoTokenizer

model_name = "finance-ner-v0.0.8-finetuned-ner"
model = AutoModelForTokenClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

✨ 主な機能

高精度識別：評価セットで、このモデルはほぼ完璧な正解率を達成し、損失はわずか0.0001で、正解率は1.0000に達しました。
多指標での優秀性：適合率、再現率、F1スコアなどの複数の重要な指標で優れた性能を発揮し、適合率は0.9994、再現率は0.9997、F1スコアは0.9995です。

📦 インストール

このモデルを使用するには、必要なライブラリをインストールする必要があります。以下のコマンドを使用してインストールできます。

pip install transformers datasets torch tokenizers

💻 使用例

基本的な使用法

from transformers import AutoModelForTokenClassification, AutoTokenizer
import torch

model_name = "finance-ner-v0.0.8-finetuned-ner"
model = AutoModelForTokenClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

text = "This is a financial text."
inputs = tokenizer(text, return_tensors="pt")
with torch.no_grad():
    outputs = model(**inputs)
logits = outputs.logits
predictions = torch.argmax(logits, dim=2)

高度な使用法

# 高度な使用法では、後処理関数を組み合わせて、予測結果を読みやすいエンティティラベルに変換できます
from transformers import AutoModelForTokenClassification, AutoTokenizer
import torch

model_name = "finance-ner-v0.0.8-finetuned-ner"
model = AutoModelForTokenClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

text = "This is a financial text."
inputs = tokenizer(text, return_tensors="pt")
with torch.no_grad():
    outputs = model(**inputs)
logits = outputs.logits
predictions = torch.argmax(logits, dim=2)

# 後処理関数の例
def convert_predictions_to_labels(predictions, id2label):
    labels = []
    for pred in predictions[0].tolist():
        labels.append(id2label[pred])
    return labels

id2label = model.config.id2label
labels = convert_predictions_to_labels(predictions, id2label)
print(labels)

📚 ドキュメント

モデルの説明

このモデルは、dslim/bert-base-NERをファインチューニングして得られたもので、金融命名エンティティ識別タスクに最適化されています。

想定用途と制限

このモデルは主に金融分野の命名エンティティ識別タスクに使用されますが、現在のドキュメントでは具体的な使用シーンと制限に関する詳細情報が不足しています。

学習と評価データ

現在のドキュメントでは、学習と評価データに関する詳細情報が不足しています。

🔧 技術詳細

学習ハイパーパラメータ

学習過程では、以下のハイパーパラメータが使用されました。

属性	詳細
学習率	2e-05
学習バッチサイズ	8
評価バッチサイズ	8
乱数シード	42
勾配累積ステップ数	2
総学習バッチサイズ	16
オプティマイザ	Adam，betas=(0.9,0.999)，epsilon=1e-08
学習率スケジューラタイプ	線形
学習エポック数	1