M

Msmarco Distilbert Base Tas B Mmarco Pt 100k

由mpjan開發
這是一個基於DistilBERT的葡萄牙語句子轉換器模型,專門用於句子相似度和語義搜索任務。
下載量 44
發布時間 : 11/3/2022

模型概述

該模型能夠將葡萄牙語句子和段落映射到768維的密集向量空間中,適用於聚類或語義搜索等任務。模型是在葡萄牙語MMARCO數據集的前10萬條三元組上微調得到的。

模型特點

葡萄牙語支持
專門針對葡萄牙語文本進行優化,適合處理葡萄牙語的語義任務。
高效向量表示
將文本轉換為768維的密集向量,保留語義信息的同時保持計算效率。
微調優化
在MMARCO葡萄牙語數據集上進行了專門微調,提升了在相似度任務上的表現。

模型能力

句子嵌入
語義相似度計算
文本聚類
信息檢索

使用案例

信息檢索
葡萄牙語文檔搜索
構建葡萄牙語文檔的語義搜索引擎
提高搜索結果的語義相關性
文本分析
葡萄牙語文本聚類
對葡萄牙語文本進行主題聚類分析
自動發現文本中的主題模式
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase