finance-ner-v0.0.8-finetuned-ner开源模型 - 精准识别金融文本命名实体

首页

Finance Ner V0.0.8 Finetuned Ner

由 AhmedTaha012 开发

本模型是在金融领域数据集上微调的命名实体识别模型，能够精准识别金融文本中的命名实体。

序列标注

Transformers

开源协议:MIT #金融实体识别 #高精度NER #BERT微调

下载量 116

发布时间 : 8/22/2023

模型简介

基于dslim/bert-base-NER微调的金融领域命名实体识别模型，专为金融信息处理优化。

模型特点

高精度识别

在评估集上实现了近乎完美的准确率（1.0000）和极低的损失（0.0001）

多指标优秀

精确率0.9994，召回率0.9997，F1分数0.9995，各项指标表现优异

金融领域优化

专门针对金融文本进行微调，适合金融信息处理场景

模型能力

金融文本实体识别

命名实体分类

使用案例

金融信息处理

金融新闻分析

从金融新闻中提取公司名、人名、金融产品等实体

高准确率识别金融相关实体

财务报告处理

自动识别财务报告中的关键实体信息

快速准确地提取财务数据相关实体

🚀 finance-ner-v0.0.8-finetuned-ner

本模型是在None数据集上对dslim/bert-base-NER进行微调后的版本。它在评估集上取得了出色的成绩，能够精准地识别金融领域的命名实体，为金融信息处理提供了高效且准确的解决方案。

🚀 快速开始

此模型可直接在Hugging Face平台上使用，你可以通过以下代码加载并使用该模型：

from transformers import AutoModelForTokenClassification, AutoTokenizer

model_name = "finance-ner-v0.0.8-finetuned-ner"
model = AutoModelForTokenClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

✨ 主要特性

高精度识别：在评估集上，该模型实现了近乎完美的准确率，损失仅为0.0001，准确率达到了1.0000。
多指标优秀：在精确率、召回率和F1分数等多个关键指标上都表现出色，精确率为0.9994，召回率为0.9997，F1分数为0.9995。

📦 安装指南

使用此模型需要安装必要的库，你可以使用以下命令进行安装：

pip install transformers datasets torch tokenizers

💻 使用示例

基础用法

from transformers import AutoModelForTokenClassification, AutoTokenizer
import torch

model_name = "finance-ner-v0.0.8-finetuned-ner"
model = AutoModelForTokenClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

text = "This is a financial text."
inputs = tokenizer(text, return_tensors="pt")
with torch.no_grad():
    outputs = model(**inputs)
logits = outputs.logits
predictions = torch.argmax(logits, dim=2)

高级用法

# 高级用法可结合后处理函数，将预测结果转换为可读的实体标签
from transformers import AutoModelForTokenClassification, AutoTokenizer
import torch

model_name = "finance-ner-v0.0.8-finetuned-ner"
model = AutoModelForTokenClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

text = "This is a financial text."
inputs = tokenizer(text, return_tensors="pt")
with torch.no_grad():
    outputs = model(**inputs)
logits = outputs.logits
predictions = torch.argmax(logits, dim=2)

# 后处理函数示例
def convert_predictions_to_labels(predictions, id2label):
    labels = []
    for pred in predictions[0].tolist():
        labels.append(id2label[pred])
    return labels

id2label = model.config.id2label
labels = convert_predictions_to_labels(predictions, id2label)
print(labels)

📚 详细文档

模型描述

本模型是基于dslim/bert-base-NER进行微调得到的，在金融命名实体识别任务上进行了优化。

预期用途与限制

该模型主要用于金融领域的命名实体识别任务，但目前文档中关于具体的使用场景和限制还需要进一步补充。

训练和评估数据

目前文档中关于训练和评估数据的详细信息还需要进一步补充。

🔧 技术细节

训练超参数

在训练过程中使用了以下超参数：

属性	详情
学习率	2e-05
训练批次大小	8
评估批次大小	8
随机种子	42
梯度累积步数	2
总训练批次大小	16
优化器	Adam，betas=(0.9,0.999)，epsilon=1e-08
学习率调度器类型	线性
训练轮数	1