G

Gliner Poly Small V1.0

由knowledgator開發
GLiNER 是一個靈活的命名實體識別(NER)模型,能夠識別任何實體類型,為傳統 NER 模型和大型語言模型提供了實用替代方案。
下載量 18
發布時間 : 8/19/2024

模型概述

GLiNER 是一個命名實體識別(NER)模型,通過雙向 Transformer 編碼器識別任何實體類型。相比傳統 NER 模型僅限於預定義實體,GLiNER 更加靈活,同時比大型語言模型(LLMs)更輕量且成本更低。

模型特點

靈活識別任何實體類型
GLiNER 能夠識別任何實體類型,而不僅限於預定義的實體集合。
雙編碼器架構
採用後融合的雙編碼器架構,文本編碼器為 DeBERTa v3 small,實體標籤編碼器為 BGE-small-en,提高了對標籤間關係的理解能力。
高效推理
若實體嵌入已預處理,推理速度更快;可一次性識別無限數量的實體。
泛化能力強
對未見實體的泛化能力更強,適合處理多樣化的實體類型。

模型能力

命名實體識別
多語言支持
高效推理
靈活實體識別

使用案例

信息提取
人物與事件提取
從文本中提取人物、日期、獎項、賽事和球隊等實體。
如示例中所示,模型能夠準確識別出克里斯蒂亞諾·羅納爾多、1985年2月5日、金球獎等實體。
社交媒體分析
推文實體識別
從社交媒體推文中提取實體,用於趨勢分析或內容分類。
在基準測試中,模型在 Broad Tweet Corpus 數據集上取得了 70.2% 的得分。
生物醫學文本分析
醫學實體識別
從生物醫學文獻中提取疾病、藥物等實體。
在 bc5cdr 數據集上取得了 60.5% 的得分。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase