🚀 Llama3新闻分析模型
本仓库包含一个用于分析给定新闻正文并执行以下任务的模型:
- 新闻摘要:将新闻文章的主要内容概括为1 - 3行。
- 情感分析:评估文章内容的情感倾向,分为积极、消极或中立。
- 股票代码识别:根据提及的公司名称提取相关股票代码。
- 广告检测:判断正文是否为广告。
🚀 快速开始
安装指南
首先,设置环境:
pip install torch transformers
使用示例
基础用法
以下是使用该模型分析新闻文章的示例代码:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained('irene93/Llama3-news-analysis')
model = AutoModelForCausalLM.from_pretrained('irene93/Llama3-news-analysis')
model = torch.nn.DataParallel(model).cuda()
device = "cuda:0"
user_content = """韩华航空航天将与‘米莱姆机器人公司’携手开展全球顶级无人车辆的研发工作。
韩华航空航天于19日宣布,与欧洲最大的无人车辆(UGV)企业米莱姆机器人公司在‘IDEX 2025’上签署了谅解备忘录,双方将扩大战略合作,共同开发最新履带式UGV——T - RCV(Tracked - Robotic Combat Vehicle),并开拓全球市场。
爱沙尼亚的‘米莱姆机器人公司’向包括美国、英国、法国等北约(NATO)8个国家在内的共计16个国家供应履带式UGV,在引领全球UGV标准化方面拥有世界顶级技术。
韩华航空航天凭借轮式UGV‘阿瑞斯麦斯’成功通过美军海外比较性能试验(FCT),并自主研发了下一代UGV‘格伦特(GRUNT)’等,其技术实力在全球市场得到认可,今年即将参与韩国陆军多用途无人车辆采购项目的供应商评选。
韩华航空航天方面表示:“双方将基于合作,为国内外客户提供应对快速变化的现代战斗环境的新方案。”
米莱姆机器人公司方面也表示:“双方将凭借创新技术和丰富的全球市场经验,全力开发尖端无人化解决方案。”"""
messages = [
{"role": "system", "content": "你是一个分析给定新闻的聊天机器人。**指示要求**:- 对给定新闻进行summary(摘要)、advr(广告标识)、stk_code(股票代码)、sent_score(情感得分)分析,并以JSON格式输出。 - summary控制在1 - 3行之间。- advr若正文为广告则输出1,否则输出0。- stk_code需找出正文中提及的股票名称,并以Python列表形式列出其股票代码。 - sent_score若正文积极则输出1,消极则输出 - 1,中立则输出0。 - 当给出正文时,结果以JSON格式输出。"},
{"role": "user", "content": user_content}
]
input_ids = tokenizer.apply_chat_template(
messages,
add_generation_prompt=True,
return_tensors="pt"
).to(device)
terminators = [
tokenizer.eos_token_id,
tokenizer.convert_tokens_to_ids("<|eot_id|>")
]
outputs = model.module.generate(
input_ids,
max_new_tokens=2048,
eos_token_id=terminators,
do_sample=False,
)
response = outputs[0][input_ids.shape[-1]:]
print(tokenizer.decode(response, skip_special_tokens=True))
示例输出
{
'summary': '韩华航空航天与米莱姆机器人公司合作开展无人车辆研发。',
'advr_tp': '0',
'stk_code': ['012450'],
'sent_score': 1
}
✨ 主要特性
- 新闻摘要:精准提炼新闻核心内容,以简洁的1 - 3行文字呈现。
- 情感分析:准确判断新闻情感倾向,分为积极、消极、中立三类。
- 股票代码识别:依据新闻中提及的公司名称,快速提取相关股票代码。
- 广告检测:有效识别新闻正文是否为广告。
📦 安装指南
pip install torch transformers
📚 详细文档
模型信息
该模型基于 meta - llama 的 Llama - 3.2 - 3B 进行训练,并使用了Hugging Face的 transformers
库。
属性 |
详情 |
模型类型 |
irene93/Llama3-news-analysis |
分词器 |
AutoTokenizer |
模型架构 |
AutoModelForCausalLM |
要求
📄 许可证
本项目遵循MIT许可证。