🚀 FinMA-7B-NLP
FinMA-7B-NLP是一款金融大语言模型(LLM),是PIXIU项目的一部分。它旨在理解复杂的金融语言和概念,并经过微调以遵循自然语言指令,从而提升其在下游金融任务中的表现。具体而言,FinMA-7B-NLP仅在PIXIU数据集的NLP任务上进行训练,因此它特别适用于情感分析、新闻标题分类、命名实体识别和问答等任务。
🚀 快速开始
FinMA-7B-NLP是一款专为理解复杂金融语言和概念而开发的金融大语言模型。它经过微调,能够遵循自然语言指令,在下游金融任务中表现出色。
✨ 主要特性
- 专业金融领域:专门针对金融领域的NLP任务进行训练,如情感分析、新闻标题分类、命名实体识别和问答等。
- 多模型协同:作为PIXIU项目的一部分,与FinMA-7B-full和FinMA-30B等其他模型协同工作,满足不同的金融任务需求。
- 易于使用:可以通过Hugging Face Transformers库在Python项目中轻松加载和使用。
📦 安装指南
你可以使用Hugging Face Transformers库在Python项目中使用FinMA-7B-NLP模型。以下是加载模型的简单示例:
from transformers import LlamaTokenizer, LlamaForCausalLM
tokenizer = LlamaTokenizer.from_pretrained('ChanceFocus/finma-7b-nlp')
model = LlamaForCausalLM.from_pretrained('ChanceFocus/finma-7b-nlp', device_map='auto')
在这个示例中,LlamaTokenizer
用于加载分词器,LlamaForCausalLM
用于加载模型。device_map='auto'
参数用于在可用时自动使用GPU。
💻 使用示例
基础用法
from transformers import LlamaTokenizer, LlamaForCausalLM
tokenizer = LlamaTokenizer.from_pretrained('ChanceFocus/finma-7b-nlp')
model = LlamaForCausalLM.from_pretrained('ChanceFocus/finma-7b-nlp', device_map='auto')
高级用法
你还可以通过Hugging Face推理API使用该模型。这允许你在无需设置自己的推理环境的情况下生成文本。模型可以按需在推理API上加载。
📚 详细文档
PIXIU项目中的其他模型
除了FinMA-7B-NLP,PIXIU项目还包括另外两个模型:FinMA-7B-full和FinMA-30B。
- FinMA-7B-full:该模型使用PIXIU数据集中的完整指令数据进行训练,涵盖了NLP和预测任务。这使得它成为一个更全面的模型,能够处理更广泛的金融任务。
- FinMA-30B:该模型是FinMA的更大版本,在LLaMA-30B模型上进行微调。与FinMA-7B-NLP一样,它使用NLP指令数据进行训练。
关于
该模型是PIXIU项目的一部分,PIXIU是一个开源资源,提供了首批金融大语言模型(LLM)、指令调优数据和评估基准,以全面评估金融LLM。其目标是持续推动金融人工智能(AI)的开源发展。
如需更多信息,你可以访问GitHub上的PIXIU项目。
📄 许可证
FinMA-7B-NLP采用MIT许可证。有关更多详细信息,请参阅MIT文件。
🔖 引用
如果你在工作中使用了FinMA-7B-NLP,请引用PIXIU论文:
@misc{xie2023pixiu,
title={PIXIU: A Large Language Model, Instruction Data and Evaluation Benchmark for Finance},
author={Qianqian Xie and Weiguang Han and Xiao Zhang and Yanzhao Lai and Min Peng and Alejandro Lopez-Lira and Jimin Huang},
year={2023},
eprint={2306.05443},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
📋 信息表格
属性 |
详情 |
数据集 |
chancefocus/pixiu、ChanceFocus/FLUPE |
语言 |
英语 |
推理 |
否 |
许可证 |
MIT |
评估指标 |
准确率、精确匹配、F1值 |
库名称 |
transformers |
标签 |
金融、llama、大语言模型 |