M

Msmarco Distilbert Base Tas B Mmarco Pt 300k

由mpjan開發
這是一個基於DistilBERT架構的葡萄牙語句子嵌入模型,專門針對語義相似度任務進行了優化。
下載量 37
發布時間 : 11/5/2022

模型概述

該模型能將葡萄牙語句子和段落映射到768維向量空間,適用於聚類、語義搜索等自然語言處理任務。

模型特點

葡萄牙語優化
專門針對葡萄牙語文本進行了微調,在葡萄牙語語義理解任務上表現更優
高效架構
基於DistilBERT架構,在保持性能的同時比標準BERT模型更輕量
語義向量表示
能將文本轉換為768維稠密向量,捕捉深層語義信息

模型能力

文本向量化
語義相似度計算
文本聚類
語義搜索

使用案例

信息檢索
葡萄牙語文檔搜索
構建基於語義的葡萄牙語搜索引擎
相比關鍵詞搜索能獲得更相關的結果
文本分析
葡萄牙語文本聚類
對葡萄牙語客戶反饋或評論進行自動分類
無需人工標註即可發現文本主題模式
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase