simcse-model-distil-m-bert開源模型 - 用於語義搜索和聚類的文本向量轉換工具

首頁

Simcse Model Distil M Bert

由mrp開發

基於m-Distil-BERT的句子轉換器模型，採用SimCSE方法訓練，可將文本映射為768維向量，適用於語義搜索和聚類任務

文本嵌入

Transformers

#泰語語義向量 #SimCSE優化 #輕量BERT

下載量 21

發布時間 : 3/2/2022

模型概述

該模型使用SimCSE對比學習方法在泰語維基百科語料上微調，能夠生成高質量的句子嵌入表示，特別適合處理泰語文本的語義相似度計算

模型特點

SimCSE訓練方法

採用對比學習框架，無需負樣本即可學習高質量句子表示

多語言能力

基於m-Distil-BERT架構，具備處理多語言文本的潛力

高效表示

將句子映射為768維稠密向量，平衡表達能力和計算效率

模型能力

句子嵌入生成

語義相似度計算

文本聚類

語義搜索

使用案例

信息檢索

相似問題查找

在FAQ系統中查找與用戶提問語義相似的問題

提高問答系統的匹配準確率

內容分析

文檔聚類

對大量文檔進行自動主題分組

實現無監督的文檔組織

屬性	詳情
模型類型	句向量轉換器
訓練數據	泰語維基百科
技術方法	SimCSE

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Simcse Model Distil M Bert

模型概述

模型特點

模型能力

使用案例

🚀 {mrp/simcse-model-distil-m-bert}

🚀 快速開始

📦 安裝指南

💻 使用示例

基礎用法

🔧 技術細節

📄 模型信息