🚀 聯合國可持續發展目標文本分類機器學習模型
本機器學習模型可根據聯合國17個可持續發展目標中的前15個對文本進行分類。該模型在較短段落(約100個單詞)上進行訓練,在處理類似長度的輸入時表現最佳。數據來源於出色的 https://osdg.ai/ 社區!
相關背景信息
消除對婦女和女童的一切形式歧視不僅是一項基本人權,而且對於加速可持續發展至關重要。事實一再證明,賦予婦女和女童權力具有乘數效應,有助於全面推動經濟增長和發展。自2000年以來,聯合國開發計劃署(UNDP)與聯合國夥伴及全球社會各界共同努力,將性別平等置於工作的核心位置。自那時起,我們已取得顯著進展。與15年前相比,現在更多女童能夠接受教育,大多數地區在初等教育階段已實現性別平等。目前,女性在農業以外的帶薪勞動者中所佔比例達到41%,而1990年這一比例為35%。
數據集
- jonas/osdg_sdg_data_processed
二氧化碳排放量
0.0653263174784986
🚀 快速開始
本模型可用於對文本進行分類,以匹配聯合國可持續發展目標。以下為使用示例。
✨ 主要特性
- 能夠根據聯合國17個可持續發展目標中的前15個對文本進行分類。
- 在較短段落(約100個單詞)上訓練,對類似長度輸入表現最佳。
📦 安裝指南
文檔未提及安裝步驟,暫不提供。
💻 使用示例
基礎用法
你可以使用cURL來訪問這個模型:
$ curl -X POST -H "Authorization: Bearer YOUR_API_KEY" -H "Content-Type: application/json" -d '{"inputs": "I love AutoTrain"}' https://api-inference.huggingface.co/models/jonas/autotrain-osdg-sdg-classifier-900229515
高級用法
使用Python API:
from transformers import AutoModelForSequenceClassification, AutoTokenizer
model = AutoModelForSequenceClassification.from_pretrained("jonas/sdg_classifier_osdg", use_auth_token=True)
tokenizer = AutoTokenizer.from_pretrained("jonas/sdg_classifier_osdg", use_auth_token=True)
inputs = tokenizer("I love AutoTrain", return_tensors="pt")
outputs = model(**inputs)
📚 詳細文檔
關於模型
本模型是用於根據聯合國可持續發展目標對文本進行分類的機器學習模型。需要注意的是,該模型在較短段落(約100個單詞)上進行訓練,在處理類似長度的輸入時表現最佳。
改進版本
有該模型的改進版本(微調後的Roberta)可在此處獲取:https://huggingface.co/jonas/roberta-base-finetuned-sdg
模型訓練詳情
- 問題類型:多類分類
- 模型ID:900229515
- 二氧化碳排放量(克):0.0653263174784986
驗證指標
指標 |
數值 |
損失 |
0.3644874095916748 |
準確率 |
0.8972544579677328 |
宏F1值 |
0.8500873710954522 |
微F1值 |
0.8972544579677328 |
加權F1值 |
0.8937529692986061 |
宏精確率 |
0.8694369727467804 |
微精確率 |
0.8972544579677328 |
加權精確率 |
0.8946984684977016 |
宏召回率 |
0.8405065997404059 |
微召回率 |
0.8972544579677328 |
加權召回率 |
0.8972544579677328 |
🔧 技術細節
模型基於多類分類問題進行訓練,使用特定的數據集進行學習,以實現對文本的分類功能。訓練過程中記錄了二氧化碳排放量,同時通過一系列驗證指標來評估模型性能。
📄 許可證
文檔未提及許可證信息,暫不提供。