A

Anglicisms Spanish Flair Cs

由lirondos開發
用於檢測西班牙新聞中未同化的英語詞彙借用的預訓練模型,能識別如'fake news'、'machine learning'等外來詞彙。
下載量 8,115
發布時間 : 3/29/2022

模型概述

該模型是一個BiLSTM-CRF模型,專門用於檢測西班牙語中使用的外來詞彙(主要來自英語),如*fake news*、*machine learning*等。

模型特點

多語言詞彙借用檢測
能夠識別西班牙語中未同化的英語詞彙借用(ENG標籤)以及其他語言的詞彙借用(OTHER標籤)。
基於語碼轉換數據預訓練
模型輸入包括基於Transformer的語碼轉換數據預訓練嵌入,提高了對混合語言文本的處理能力。
高挑戰性測試集
測試集設計極具挑戰性,覆蓋訓練集未見的來源和日期,包含大量未登錄詞(92%的借用詞為OOV)。

模型能力

識別西班牙語中的英語藉詞
識別西班牙語中的其他語言藉詞
處理多詞借用的識別

使用案例

新聞媒體分析
檢測新聞中的英語藉詞
分析西班牙新聞中使用的英語詞彙,如'fake news'、'prime time'等。
精確率90.16%,召回率84.34%,F1值87.16%(ENG標籤)
語言學研究
詞彙借用研究
用於研究西班牙語中未同化詞彙借用的分佈和趨勢。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase