開源SimCSE-model-XLMR模型 - 可實現句子段落聚類及語義搜索

首頁

Simcse Model XLMR

由kornwtp開發

基於XLM-R的sentence-transformers模型，使用SimCSE方法訓練，可將句子和段落映射到768維密集向量空間，適用於聚類或語義搜索等任務。

文本嵌入

Transformers

開源協議:Apache-2.0 #多語言句子嵌入 #泰語語義匹配 #SimCSE優化

下載量 20

發布時間 : 12/22/2023

模型概述

該模型利用SimCSE方法在泰語維基百科數據上訓練，能夠生成高質量的句子嵌入表示，支持多語言處理。

模型特點

SimCSE訓練方法

採用對比學習框架SimCSE進行訓練，提升了句子嵌入的質量。

多語言支持

基於XLM-R架構，具備處理多語言文本的能力。

高維向量表示

將句子映射到768維密集向量空間，保留豐富的語義信息。

模型能力

句子嵌入生成

語義相似度計算

文本聚類

語義搜索

使用案例

信息檢索

相似文檔檢索

通過計算句子嵌入的相似度，快速找到語義相近的文檔。

提高檢索準確率和效率

文本分析

文本聚類

利用句子嵌入對大量文本進行自動分類和聚類。

發現文本數據中的潛在模式和主題

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Simcse Model XLMR

模型概述

模型特點

模型能力

使用案例

🚀 {kornwtp/simcse-model-XLMR}

🚀 快速開始

✨ 主要特性

📦 安裝指南

💻 使用示例

基礎用法

📄 許可證