🚀 政治氣候模型卡
本模型用於檢測(政治)文本中氣候變化的顯著性。它通過對政治宣言中的文本進行分析,幫助識別氣候變化相關內容的突出程度,為政治和氣候研究提供了有力的工具。
🚀 快速開始
你可以使用該模型進行文本分類,也可以將其作為基礎模型進行進一步的微調以完成其他任務。simpletransformers
包讓這個過程變得非常簡單。
基礎用法
import simpletransformers
from simpletransformers.classification import ClassificationModel, ClassificationArgs
data = pd.read_csv('your_data.csv')
model = ClassificationModel(
model_type = "xlmroberta", model_name = 'policlim'
)
preds,output = model.predict(data['text'].tolist())
高級用法
from sklearn.metrics import f1_score, precision, accuracy, recall
new_train = pd.read_csv('your_new_train_data.csv')
new_test = pd.read_csv('your_new_test_data.csv')
new_eval = pd.read_csv('your_new_eval_data.csv')
model = ClassificationModel(
model_type="xlmroberta",
model_name="policlim",
num_labels=2,
ignore_mismatched_sizes=True,
use_cuda=True
)
model.train_model(train_df = new_train, eval_df = new_test,
f1_train = f1_score(labels, preds,average=None)
)
result, model_outputs, wrong_predictions = model.eval_model(val_df,
f1_eval = f1_score(labels, preds,average=None),
precision = precision(labels, preds,average=None),
recall = recall(labels, preds,average=None),
acc = accuracy_score(labels, preds,average=None)
)
print('\n\n這些是在測試數據集上測試模型時的結果:\n')
print(result)
✨ 主要特性
此模型可檢測(政治)文本中的氣候變化顯著性。它基於 XLM - roberta 進行微調,使用了來自政治宣言的 3434 條手動標註的準句子(從 Manifesteo 項目數據庫 獲取)來檢測氣候變化顯著性。該模型在驗證集上實現了 0.935 的 F1 分數和 0.957 的準確率。
📦 安裝指南
文檔未提及具體安裝步驟,故跳過此章節。
📚 詳細文檔
我們使用該模型對政治宣言的氣候變化顯著性進行了分類,第一步的詳細內容在下面的工作論文中。該論文包含了訓練集、訓練過程、模型評估以及最終數據集的所有相關細節。
🔧 技術細節
該模型通過對基礎的 XLM - roberta 模型進行微調實現功能。使用從政治宣言中手動標註的 3434 條準句子作為訓練數據,在驗證集上取得了較好的效果,F1 分數達到 0.935,準確率達到 0.957。
📄 許可證
文檔未提及許可證信息,故跳過此章節。
📄 引用信息
@techreport{sanford2024policlim,
title={Policlim: A Dataset of Climate Change Discourse in the Political Manifestos of 45 Countries from 1990-2022},
author={Sanford, Mary and Pianta, Silvia and Schmid, Nicolas and Musto, Giorgio},
type={Working paper},
doi={https://osf.io/preprints/osf/bq356_v4},
year={2025}
}
📊 模型信息
屬性 |
詳情 |
模型類型 |
基於 XLM - roberta 的文本分類模型 |
訓練數據 |
來自政治宣言的 3434 條手動標註的準句子(從 Manifesteo 項目數據庫 獲取) |
🔗 模型來源
- 倉庫地址:https://github.com/marysanford/policlim/tree/main
- 論文地址:https://osf.io/preprints/osf/bq356
- 數據來源:https://manifesto-project.wzb.eu/
👥 模型卡片作者
Mary Sanford,mary.sanford@cmcc.it