D

Dist Mpnet Paracrawl Cs En

由Seznam開發
基於BERT-small架構的蒸餾模型,專為捷克語-英語語義嵌入設計
下載量 393
發布時間 : 11/2/2023

模型概述

該模型是基於BERT-small架構的蒸餾模型,主要用於生成高質量的語義嵌入向量,適用於相似性搜索、信息檢索、文本聚類和分類等任務。

模型特點

多語言支持
支持捷克語和英語的雙語語義嵌入
蒸餾技術
基於蒸餾技術從all-mpnet-base-v2模型遷移知識,保持高性能的同時減小模型規模
高質量嵌入
生成高質量的語義嵌入向量,適用於多種下游任務

模型能力

語義相似度計算
文本嵌入生成
跨語言檢索
文本聚類
文本分類

使用案例

信息檢索
跨語言文檔檢索
使用模型生成的嵌入向量進行捷克語和英語文檔的相似性檢索
提高跨語言檢索的準確性和效率
文本分析
文本聚類
對捷克語或英語文本進行自動聚類分析
發現文本數據中的潛在主題和模式
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase