S

Science Keyword Classification

由nasa-impact開發
基於INDUS模型微調,用於對NASA通用元數據存儲庫中的科學關鍵詞進行分類,提升地球觀測元數據的可訪問性和組織性。
下載量 131
發布時間 : 10/11/2024

模型概述

該模型在極端多標籤分類環境下工作,能夠處理大量潛在標籤並應對標籤頻率不平衡問題,通過預測相關關鍵詞來優化NASA地球觀測元數據的組織。

模型特點

極端多標籤分類
能夠處理大量潛在標籤(關鍵詞)的分類問題,並且可以應對標籤頻率不平衡的情況。
分層數據拆分
數據集基於provider-id進行拆分,確保訓練集、驗證集和測試集之間的平衡表示。
優化的焦點損失
使用焦點損失(γ=2)替代交叉熵損失,通過關注難以分類的樣本來解決標籤不平衡問題,顯著提升性能指標。

模型能力

科學關鍵詞分類
極端多標籤預測
元數據組織優化

使用案例

地球觀測數據管理
NASA元數據關鍵詞自動標註
為NASA通用元數據存儲庫中的科學數據自動分配相關關鍵詞
提高元數據的可發現性和組織效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase