🚀 DeBERTa-v3-base零樣本分類模型
本項目託管了一個經過微調的DeBERTa-v3-base
模型,專門用於零樣本文本分類。藉助該模型,你無需為特定任務重新訓練模型,即可將文本分類到預定義的類別中。對於標註數據稀缺的任務或文本分類解決方案的快速原型開發而言,它是理想之選。
🚀 快速開始
本模型旨在與Hugging Face的transformers
庫無縫集成。以下是一個簡單的示例:
from transformers import pipeline
classifier = pipeline("zero-shot-classification", model="syedkhalid076/DeBERTa-Zero-Shot-Classification")
sequence_to_classify = "Last week I upgraded my iOS version and ever since then your app is crashing."
candidate_labels = ["mobile", "website", "billing", "account access", "app crash"]
output = classifier(sequence_to_classify, candidate_labels, multi_label=False)
print(output)
✨ 主要特性
- 零樣本分類:無需額外訓練,即可直接將文本分類到任何用戶定義的標籤集合中。
- 多標籤支持:處理具有重疊類別或多個適用標籤的任務(設置
multi_label=True
)。
- 預訓練效率:使用混合精度(
float16
)和SafeTensors進行推理優化。
📚 詳細文檔
模型概述
屬性 |
詳情 |
基礎模型 |
DeBERTa-v3-base |
架構 |
DebertaV2ForSequenceClassification |
語言 |
英語 (en ) |
數據類型 |
float16 (採用SafeTensor格式以提高效率) |
該模型利用了DeBERTa-v3-base
的能力,並在multi_nli
、facebook/anli
和fever
等數據集上進行了微調,以提升其零樣本分類性能。
應用場景
我訓練此模型是出於用戶體驗研究目的,但它可用於以下任何任務:
- 客戶反饋分析:對用戶評論或反饋進行分類。
- 意圖檢測:識別對話式人工智能系統中的用戶意圖。
- 內容分類:對文章、社交媒體帖子或文檔進行分類。
- 錯誤檢測:檢測日誌或反饋中的錯誤報告。
訓練數據
該模型在以下數據集上進行了微調:
這些數據集有助於模型在廣泛的零樣本分類任務中實現泛化。
性能表現
該模型在各種零樣本分類基準測試中表現出色,能夠有效區分不同文本輸入中的用戶定義類別。
侷限性
- 語言支持:目前僅支持英語 (
en
)。
- 上下文長度:對於極長的文本輸入,性能可能會下降。建議將輸入截斷至模型的最大標記長度。
📄 許可證
本模型採用MIT許可證。你可以自由使用、修改和分發該模型,但需進行適當的引用。
🔗 引用
如果你在工作中使用了此模型,請引用此倉庫:
@misc{syedkhalid076_deberta_zeroshoot,
author = {Syed Khalid Hussain},
title = {DeBERTa Zero-Shot Classification},
year = {2024},
url = {https://huggingface.co/syedkhalid076/DeBERTa-Zero-Shot-Classification}
}
🙏 致謝
本模型使用 Hugging Face Transformers 進行微調,並託管在Hugging Face模型中心。特別感謝DeBERTa-v3
的開發者以及貢獻數據集的人員。