🚀 Llama3新聞分析模型
本倉庫包含一個用於分析給定新聞正文並執行以下任務的模型:
- 新聞摘要:將新聞文章的主要內容概括為1 - 3行。
- 情感分析:評估文章內容的情感傾向,分為積極、消極或中立。
- 股票代碼識別:根據提及的公司名稱提取相關股票代碼。
- 廣告檢測:判斷正文是否為廣告。
🚀 快速開始
安裝指南
首先,設置環境:
pip install torch transformers
使用示例
基礎用法
以下是使用該模型分析新聞文章的示例代碼:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained('irene93/Llama3-news-analysis')
model = AutoModelForCausalLM.from_pretrained('irene93/Llama3-news-analysis')
model = torch.nn.DataParallel(model).cuda()
device = "cuda:0"
user_content = """韓華航空航天將與‘米萊姆機器人公司’攜手開展全球頂級無人車輛的研發工作。
韓華航空航天於19日宣佈,與歐洲最大的無人車輛(UGV)企業米萊姆機器人公司在‘IDEX 2025’上籤署了諒解備忘錄,雙方將擴大戰略合作,共同開發最新履帶式UGV——T - RCV(Tracked - Robotic Combat Vehicle),並開拓全球市場。
愛沙尼亞的‘米萊姆機器人公司’向包括美國、英國、法國等北約(NATO)8個國家在內的共計16個國家供應履帶式UGV,在引領全球UGV標準化方面擁有世界頂級技術。
韓華航空航天憑藉輪式UGV‘阿瑞斯麥斯’成功通過美軍海外比較性能試驗(FCT),並自主研發了下一代UGV‘格倫特(GRUNT)’等,其技術實力在全球市場得到認可,今年即將參與韓國陸軍多用途無人車輛採購項目的供應商評選。
韓華航空航天方面表示:“雙方將基於合作,為國內外客戶提供應對快速變化的現代戰鬥環境的新方案。”
米萊姆機器人公司方面也表示:“雙方將憑藉創新技術和豐富的全球市場經驗,全力開發尖端無人化解決方案。”"""
messages = [
{"role": "system", "content": "你是一個分析給定新聞的聊天機器人。**指示要求**:- 對給定新聞進行summary(摘要)、advr(廣告標識)、stk_code(股票代碼)、sent_score(情感得分)分析,並以JSON格式輸出。 - summary控制在1 - 3行之間。- advr若正文為廣告則輸出1,否則輸出0。- stk_code需找出正文中提及的股票名稱,並以Python列表形式列出其股票代碼。 - sent_score若正文積極則輸出1,消極則輸出 - 1,中立則輸出0。 - 當給出正文時,結果以JSON格式輸出。"},
{"role": "user", "content": user_content}
]
input_ids = tokenizer.apply_chat_template(
messages,
add_generation_prompt=True,
return_tensors="pt"
).to(device)
terminators = [
tokenizer.eos_token_id,
tokenizer.convert_tokens_to_ids("<|eot_id|>")
]
outputs = model.module.generate(
input_ids,
max_new_tokens=2048,
eos_token_id=terminators,
do_sample=False,
)
response = outputs[0][input_ids.shape[-1]:]
print(tokenizer.decode(response, skip_special_tokens=True))
示例輸出
{
'summary': '韓華航空航天與米萊姆機器人公司合作開展無人車輛研發。',
'advr_tp': '0',
'stk_code': ['012450'],
'sent_score': 1
}
✨ 主要特性
- 新聞摘要:精準提煉新聞核心內容,以簡潔的1 - 3行文字呈現。
- 情感分析:準確判斷新聞情感傾向,分為積極、消極、中立三類。
- 股票代碼識別:依據新聞中提及的公司名稱,快速提取相關股票代碼。
- 廣告檢測:有效識別新聞正文是否為廣告。
📦 安裝指南
pip install torch transformers
📚 詳細文檔
模型信息
該模型基於 meta - llama 的 Llama - 3.2 - 3B 進行訓練,並使用了Hugging Face的 transformers
庫。
屬性 |
詳情 |
模型類型 |
irene93/Llama3-news-analysis |
分詞器 |
AutoTokenizer |
模型架構 |
AutoModelForCausalLM |
要求
📄 許可證
本項目遵循MIT許可證。