D

Dist Mpnet Czeng Cs En

由Seznam開發
這是一個從all-mpnet-base-v2模型蒸餾得到的捷克語-英語雙語BERT-small模型,由Seznam.cz開發,專注於語義嵌入任務。
下載量 1,232
發布時間 : 11/2/2023

模型概述

該模型是通過知識蒸餾技術從大型MPNet模型壓縮得到的小型語義嵌入模型,支持捷克語和英語,適用於多種自然語言處理任務。

模型特點

雙語支持
同時支持捷克語和英語的語義嵌入計算
高效蒸餾
通過知識蒸餾技術保留大模型性能的同時顯著減小模型尺寸
高質量嵌入
在多種語義任務中表現優異,包括相似性搜索和文本分類

模型能力

計算句子相似度
生成語義嵌入向量
支持跨語言語義匹配

使用案例

信息檢索
跨語言文檔檢索
使用該模型可以構建支持捷克語和英語的跨語言文檔檢索系統
能夠有效匹配不同語言但語義相似的文檔
文本分析
文本聚類
利用模型生成的嵌入向量對捷克語和英語文本進行聚類分析
能夠發現跨語言的相似主題內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase