H

Hoogberta NER Lst20

由lst-nectec開發
針對泰語命名實體識別任務微調的預訓練語言模型,基於LST20數據集
下載量 95
發布時間 : 4/5/2023

模型概述

HoogBERTa是針對泰語自然語言處理任務開發的預訓練語言模型,該版本專門針對命名實體識別(NER)任務在LST20數據集上進行了微調。

模型特點

泰語優化
專門針對泰語特性進行優化的預訓練語言模型
多任務支持
支持命名實體識別、詞性標註和子句邊界分類等多種任務
預分詞處理
採用BEST標準的預分詞處理,確保輸入質量

模型能力

泰語文本處理
命名實體識別
詞性標註
子句邊界分類

使用案例

文本分析
泰語文本實體提取
從泰語文本中識別並分類命名實體
可準確識別LST20數據集中定義的各種實體類型
語言處理
泰語文本預處理
為下游NLP任務提供預處理支持
提供詞性標註和子句邊界識別功能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase