P

Pearl Small

由Lihuchen開發
珍珠小模型是一款輕量級字符串嵌入模型,專門用於處理字符串語義相似度計算,為字符串匹配、實體檢索等任務生成優質嵌入向量。
下載量 1,824
發布時間 : 2/4/2024

模型概述

該模型融合了短語類型信息和詞形特徵,能更精準捕捉字符串的形態變化。基於E5-small微調而成,可為短語和字符串生成更優質的向量表示。

模型特點

高質量短語表徵
學習高質量通用短語表徵,優於傳統句子嵌入模型
輕量級設計
僅3400萬參數,內存佔用小,推理速度快
形態感知
融合詞形特徵,能精準捕捉字符串的形態變化

模型能力

計算字符串語義相似度
生成短語嵌入向量
實體檢索
字符串匹配
實體聚類
模糊連接

使用案例

信息檢索
實體鏈接
將文本中提到的實體鏈接到知識庫中的標準實體
在YAGO數據集上達到48.1分
字符串匹配
匹配不同來源但語義相似的字符串
在PPDB數據集上達到97.0分
數據集成
模糊連接
連接不同數據源中表示相同實體的記錄
在AutoFJ任務上達到75.2分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase