A

All Datasets V3 MiniLM L12

由flax-sentence-embeddings開發
基於MiniLM-L12架構的句子嵌入模型,通過對比學習在超10億句對數據集上訓練,可生成高質量的語義向量表示
下載量 887
發布時間 : 3/2/2022

模型概述

該模型是專為句子級語義理解設計的編碼器,可將輸入文本轉換為384維向量表示,適用於信息檢索、文本相似度計算等場景

模型特點

大規模對比學習訓練
在包含10億句對的多樣化數據集上進行對比學習訓練,增強模型語義理解能力
高效輕量架構
基於MiniLM-L12的輕量級Transformer架構,在保持性能的同時降低計算資源需求
多源數據融合
整合來自23個不同領域的數據源,使模型具備廣泛的語義覆蓋能力

模型能力

文本向量化
語義相似度計算
信息檢索增強
文本聚類分析

使用案例

信息檢索
搜索引擎結果優化
通過語義匹配提升搜索結果相關性
可識別查詢意圖,返回更符合用戶需求的文檔
智能客服
問題相似度匹配
識別用戶問題與知識庫問題的語義相似度
提高自動問答系統的準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase