M

Minilm L6 Danish Encoder

由KennethTM開發
這是一個輕量級的丹麥語句子嵌入模型,基於英文MiniLM模型調整,適用於丹麥語文本處理任務。
下載量 5,802
發布時間 : 1/9/2024

模型概述

該模型能將丹麥語句子和段落映射到384維向量空間,支持聚類和語義搜索等任務。基於英文MiniLM模型調整,使用丹麥語分詞器,並在機器翻譯的丹麥語數據上訓練。

模型特點

輕量級設計
僅約2200萬參數,計算資源需求低
丹麥語優化
使用丹麥語分詞器專門調整,適合丹麥語文本處理
長文本支持
最大支持512個標記的序列長度
遷移學習
基於英文MiniLM模型調整,而非從頭訓練

模型能力

文本嵌入
句子相似度計算
語義搜索
文本聚類

使用案例

信息檢索
丹麥語語義搜索
構建丹麥語搜索引擎,實現基於語義而非關鍵詞的搜索
能理解查詢意圖,返回相關結果
文本分析
丹麥語文本聚類
對丹麥語文檔或用戶評論進行自動分組
發現相似內容或主題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase