T

Tags Allnli GroNLP Bert Base Dutch Cased

由textgain開發
基於荷蘭語BERT的句子嵌入模型,可將文本映射至768維向量空間,適用於語義相似度計算和文本分類任務
下載量 1,067
發布時間 : 2/23/2023

模型概述

該模型是基於sentence-transformers框架的荷蘭語BERT模型,專門用於生成句子級嵌入向量,支持語義搜索、聚類和文本分類等自然語言處理任務。

模型特點

荷蘭語優化
基於GroNLP的bert-base-dutch-cased模型專門針對荷蘭語文本進行優化
高效語義編碼
將變長句子編碼為固定768維稠密向量,保留語義信息
多任務適用
生成的嵌入向量可用於聚類、語義搜索和分類等多種下游任務

模型能力

句子向量化
語義相似度計算
文本特徵提取
主題分類
文本聚類

使用案例

媒體內容分析
新聞主題分類
如示例所示,可對新聞內容進行IPTC標準主題分類
能準確識別災害類新聞內容
信息檢索
語義搜索
基於語義相似度而非關鍵詞匹配的文檔檢索
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase