Multilingual Sentiment Analysis
M
Multilingual Sentiment Analysis
由tabularisai開發
一個基於DistilBERT微調的多語言情感分析模型,支持21種語言,適用於社交媒體、客戶反饋等多場景分析。
下載量 162.07k
發布時間 : 12/7/2024
模型概述
該模型專門用於文本情感分類,能夠識別'非常負面'到'非常正面'五種情感強度,適用於多語言環境下的情感分析任務。
模型特點
多語言支持
支持21種語言的情感分析,覆蓋全球主要語言區域
高效架構
基於DistilBERT的輕量級架構,在保持性能的同時減少計算資源需求
五級情感分類
能夠區分'非常負面'到'非常正面'五種情感強度,提供更細緻的分析
合成數據訓練
使用LLM生成的合成多語言數據進行訓練,確保覆蓋多種語言的豐富情感表達
模型能力
文本分類
情感分析
多語言處理
社交媒體內容分析
客戶反饋分類
使用案例
社交媒體分析
多語言社交媒體監控
分析不同語言社交媒體上的品牌提及情感傾向
識別全球範圍內的品牌情感趨勢
客戶反饋分析
國際客戶反饋分類
自動分類來自不同語言客戶的反饋情感
提高客戶服務響應效率
市場研究
全球產品評論分析
分析不同地區用戶對產品的評價情感
識別產品在不同市場的接受度
🚀 distilbert-based多語言情感分類模型
本模型是一個基於distilbert的多語言情感分類模型,可支持多種語言的情感分析,廣泛應用於社交媒體監測、客戶反饋分析等多個領域,能有效提升全球業務的情感洞察能力。
🚀 快速開始
使用管道(pipelines),僅需4行代碼:
from transformers import pipeline
# Load the classification pipeline with the specified model
pipe = pipeline("text-classification", model="tabularisai/multilingual-sentiment-analysis")
# Classify a new sentence
sentence = "I love this product! It's amazing and works perfectly."
result = pipe(sentence)
# Print the result
print(result)
以下是一個不使用管道的Python示例,展示如何使用多語言情感模型:
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
model_name = "tabularisai/multilingual-sentiment-analysis"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
def predict_sentiment(texts):
inputs = tokenizer(texts, return_tensors="pt", truncation=True, padding=True, max_length=512)
with torch.no_grad():
outputs = model(**inputs)
probabilities = torch.nn.functional.softmax(outputs.logits, dim=-1)
sentiment_map = {0: "Very Negative", 1: "Negative", 2: "Neutral", 3: "Positive", 4: "Very Positive"}
return [sentiment_map[p] for p in torch.argmax(probabilities, dim=-1).tolist()]
texts = [
# English
"I absolutely love the new design of this app!", "The customer service was disappointing.", "The weather is fine, nothing special.",
# Chinese
"這家餐廳的菜味道非常棒!", "我對他的回答很失望。", "天氣今天一般。",
# Spanish
"¡Me encanta cómo quedó la decoración!", "El servicio fue terrible y muy lento.", "El libro estuvo más o menos.",
# Arabic
"الخدمة في هذا الفندق رائعة جدًا!", "لم يعجبني الطعام في هذا المطعم.", "كانت الرحلة عادية。",
# Ukrainian
"Мені дуже сподобалася ця вистава!", "Обслуговування було жахливим.", "Книга була посередньою。",
# Hindi
"यह जगह सच में अद्भुत है!", "यह अनुभव बहुत खराब था।", "फिल्म ठीक-ठाक थी।",
# Bengali
"এখানকার পরিবেশ অসাধারণ!", "সেবার মান একেবারেই খারাপ।", "খাবারটা মোটামুটি ছিল।",
# Portuguese
"Este livro é fantástico! Eu aprendi muitas coisas novas e inspiradoras.",
"Não gostei do produto, veio quebrado.", "O filme foi ok, nada de especial.",
# Japanese
"このレストランの料理は本當に美味しいです!", "このホテルのサービスはがっかりしました。", "天気はまあまあです。",
# Russian
"Я в восторге от этого нового гаджета!", "Этот сервис оставил у меня только разочарование.", "Встреча была обычной, ничего особенного.",
# French
"J'adore ce restaurant, c'est excellent !", "L'attente était trop longue et frustrante.", "Le film était moyen, sans plus.",
# Turkish
"Bu otelin manzarasına bayıldım!", "Ürün tam bir hayal kırıklığıydı.", "Konser fena değildi, ortalamaydı.",
# Italian
"Adoro questo posto, è fantastico!", "Il servizio clienti è stato pessimo.", "La cena era nella media.",
# Polish
"Uwielbiam tę restaurację, jedzenie jest świetne!", "Obsługa klienta była rozczarowująca.", "Pogoda jest w porządku, nic szczególnego.",
# Tagalog
"Ang ganda ng lugar na ito, sobrang aliwalas!", "Hindi maganda ang serbisyo nila dito.", "Maayos lang ang palabas, walang espesyal.",
# Dutch
"Ik ben echt blij met mijn nieuwe aankoop!", "De klantenservice was echt slecht.", "De presentatie was gewoon oké, niet bijzonder.",
# Malay
"Saya suka makanan di sini, sangat sedap!", "Pengalaman ini sangat mengecewakan.", "Hari ini cuacanya biasa sahaja.",
# Korean
"이 가게의 케이크는 정말 맛있어요!", "서비스가 너무 별로였어요.", "날씨가 그저 그렇네요.",
# Swiss German
"Ich find dä Service i de Beiz mega guet!", "Däs Esä het mir nöd gfalle.", "D Wätter hüt isch so naja."
]
for text, sentiment in zip(texts, predict_sentiment(texts)):
print(f"Text: {text}\nSentiment: {sentiment}\n")
✨ 主要特性
- 多語言支持:支持英語、中文、西班牙語、印地語等多種語言。
- 多場景應用:可用於社交媒體分析、客戶反饋分析、產品評論分類、品牌監測等多個領域。
- 合成數據訓練:使用先進大語言模型生成的合成多語言數據進行訓練,確保在不同語言和文化背景下都有良好表現。
📦 安裝指南
文檔未提及安裝步驟,暫不提供。
📚 詳細文檔
模型詳情
模型名稱
:tabularisai/multilingual-sentiment-analysis基礎模型
:distilbert/distilbert-base-multilingual-cased任務
:文本分類(情感分析)支持語言
:支持英語、中文(中文)、西班牙語(Español)、印地語(हिन्दी)、阿拉伯語(العربية)、孟加拉語(বাংলা)、葡萄牙語(Português)、俄語(Русский)、日語(日本語)、德語(Deutsch)、馬來語(Bahasa Melayu)、泰盧固語(తెలుగు)、越南語(Tiếng Việt)、韓語(한국어)、法語(Français)、土耳其語(Türkçe)、意大利語(Italiano)、波蘭語(Polski)、烏克蘭語(Українська)、他加祿語、荷蘭語(Nederlands)、瑞士德語(Schweizerdeutsch)。類別數量
:5(非常負面、負面、中性、正面、非常正面)應用場景
:- 社交媒體分析
- 客戶反饋分析
- 產品評論分類
- 品牌監測
- 市場調研
- 客戶服務優化
- 競爭情報
模型描述
該模型是distilbert/distilbert-base-multilingual-cased
的微調版本,用於多語言情感分析。它利用來自多個來源的合成數據,在不同語言和文化背景下實現了穩健的性能。
訓練數據
僅使用先進大語言模型生成的合成多語言數據進行訓練,確保廣泛覆蓋各種語言的情感表達。
訓練過程
- 微調3.5個週期。
- 在驗證數據集上的train_acc_off_by_one約為0.93。
預期用途
適用於:
- 多語言社交媒體監測
- 國際客戶反饋分析
- 全球產品評論情感分類
- 全球品牌情感跟蹤
🔧 技術細節
合成數據可減少偏差,但建議在實際場景中進行驗證。
📄 許可證
本模型使用的許可證為cc-by-nc-4.0。
引用信息
Will be included.
聯繫我們
如有諮詢、數據、私有API或更優模型等需求,請聯繫info@tabularis.ai。
tabularis.ai
Distilbert Base Uncased Finetuned Sst 2 English
Apache-2.0
基於DistilBERT-base-uncased在SST-2情感分析數據集上微調的文本分類模型,準確率91.3%
文本分類 英語
D
distilbert
5.2M
746
Xlm Roberta Base Language Detection
MIT
基於XLM-RoBERTa的多語言檢測模型,支持20種語言的文本分類
文本分類
Transformers 支持多種語言

X
papluca
2.7M
333
Roberta Hate Speech Dynabench R4 Target
該模型通過動態生成數據集來改進在線仇恨檢測,專注於從最差案例中學習以提高檢測效果。
文本分類
Transformers 英語

R
facebook
2.0M
80
Bert Base Multilingual Uncased Sentiment
MIT
基於bert-base-multilingual-uncased微調的多語言情感分析模型,支持6種語言的商品評論情感分析
文本分類 支持多種語言
B
nlptown
1.8M
371
Emotion English Distilroberta Base
基於DistilRoBERTa-base微調的英文文本情感分類模型,可預測埃克曼六種基本情緒及中性類別。
文本分類
Transformers 英語

E
j-hartmann
1.1M
402
Robertuito Sentiment Analysis
基於RoBERTuito的西班牙語推文情感分析模型,支持POS(積極)/NEG(消極)/NEU(中性)三類情感分類
文本分類 西班牙語
R
pysentimiento
1.0M
88
Finbert Tone
FinBERT是一款基於金融通訊文本預訓練的BERT模型,專注於金融自然語言處理領域。finbert-tone是其微調版本,用於金融情感分析任務。
文本分類
Transformers 英語

F
yiyanghkust
998.46k
178
Roberta Base Go Emotions
MIT
基於RoBERTa-base的多標籤情感分類模型,在go_emotions數據集上訓練,支持28種情感標籤識別。
文本分類
Transformers 英語

R
SamLowe
848.12k
565
Xlm Emo T
XLM-EMO是一個基於XLM-T模型微調的多語言情感分析模型,支持19種語言,專門針對社交媒體文本的情感預測。
文本分類
Transformers 其他

X
MilaNLProc
692.30k
7
Deberta V3 Base Mnli Fever Anli
MIT
基於MultiNLI、Fever-NLI和ANLI數據集訓練的DeBERTa-v3模型,擅長零樣本分類和自然語言推理任務
文本分類
Transformers 英語

D
MoritzLaurer
613.93k
204
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98