M

Multi Sentence BERTino

由nickprock開發
這是一個基於BERTino的句子轉換器模型,能夠將意大利語句子和段落映射到768維的密集向量空間,適用於聚類或語義搜索等任務。
下載量 63.88k
發布時間 : 1/10/2024

模型概述

該模型基於indigo-ai/BERTino訓練,使用了意大利語的mmarco和stsb數據集,主要用於句子相似度計算和特徵提取。

模型特點

意大利語支持
專門針對意大利語優化,能夠有效處理意大利語句子和段落的語義表示。
高效向量化
將文本轉換為768維的密集向量,便於後續的相似度計算和聚類分析。
多數據集訓練
使用mmarco(20萬條)和stsb兩個意大利語數據集進行訓練,提高了模型的泛化能力。

模型能力

句子相似度計算
文本特徵提取
語義搜索
文本聚類

使用案例

信息檢索
語義搜索
在意大利語文檔集合中查找語義相似的句子或段落。
提高搜索結果的準確性和相關性
文本分析
文本聚類
將意大利語文本按語義相似度進行自動分組。
實現無監督的文本分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase