A

Anglicisms Spanish Flair Cs

lirondosによって開発
スペイン語ニュースにおける未同化の英語借用語(例:'fake news'、'machine learning'など)を検出するための事前学習済みモデルです。
ダウンロード数 8,115
リリース時間 : 3/29/2022

モデル概要

このモデルはBiLSTM-CRFモデルで、スペイン語で使用される外来語(主に英語由来、例:*fake news*、*machine learning*など)を検出するために特別に設計されています。

モデル特徴

多言語借用語検出
スペイン語における未同化の英語借用語(ENGタグ)およびその他の言語の借用語(OTHERタグ)を識別できます。
コードスイッチングデータに基づく事前学習
Transformerベースのコードスイッチングデータ事前学習埋め込みを含むモデル入力により、混合言語テキストの処理能力が向上しています。
高難易度テストセット
テストセットは非常に挑戦的な設計で、トレーニングセットに含まれていないソースや日付をカバーし、多数の未知語(借用語の92%がOOV)を含みます。

モデル能力

スペイン語中の英語借用語の識別
スペイン語中の他言語借用語の識別
複数語の借用識別処理

使用事例

ニュースメディア分析
ニュース中の英語借用語検出
スペイン語ニュースで使用される英語借用語(例:'fake news'、'prime time'など)の分析
適合率90.16%、再現率84.34%、F1値87.16%(ENGタグ)
言語学研究
借用語研究
スペイン語における未同化借用語の分布と傾向を研究するために使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase