D

Dist Mpnet Czeng Cs En

Developed by Seznam
這是一個從all-mpnet-base-v2模型蒸餾得到的捷克語-英語雙語BERT-small模型,由Seznam.cz開發,專注於語義嵌入任務。
Downloads 1,232
Release Time : 11/2/2023

Model Overview

該模型是通過知識蒸餾技術從大型MPNet模型壓縮得到的小型語義嵌入模型,支持捷克語和英語,適用於多種自然語言處理任務。

Model Features

雙語支持
同時支持捷克語和英語的語義嵌入計算
高效蒸餾
通過知識蒸餾技術保留大模型性能的同時顯著減小模型尺寸
高質量嵌入
在多種語義任務中表現優異,包括相似性搜索和文本分類

Model Capabilities

計算句子相似度
生成語義嵌入向量
支持跨語言語義匹配

Use Cases

信息檢索
跨語言文檔檢索
使用該模型可以構建支持捷克語和英語的跨語言文檔檢索系統
能夠有效匹配不同語言但語義相似的文檔
文本分析
文本聚類
利用模型生成的嵌入向量對捷克語和英語文本進行聚類分析
能夠發現跨語言的相似主題內容
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase