text2vec-base-chinese開源模型 - 支持中文文本向量化與句子相似度計算！

首頁

Text2vec Base Chinese

由GanymedeNil開發

基於shibing624/text2vec-base-chinese的衍生模型，將MacBERT替換為LERT，並保持其他訓練條件不變，支持中文文本向量化和句子相似度計算。

文本嵌入

Transformers

中文開源協議:Apache-2.0 #LERT向量化 #中文句子相似度 #ONNX推理優化

下載量 1,613

發布時間 : 3/7/2023

模型概述

該模型是一箇中文文本向量化模型，主要用於特徵提取和句子相似度計算。它是基於shibing624/text2vec-base-chinese的改進版本，將原始架構中的MacBERT替換為LERT，同時保持其他訓練條件不變。

模型特點

LERT架構

將原始模型中的MacBERT替換為LERT，可能帶來更好的性能或效率。

ONNX支持

提供ONNX運行時版本，便於在不同平臺上部署和推理。

中文優化

專門針對中文文本進行優化，適合中文自然語言處理任務。

模型能力

文本向量化

特徵提取

句子相似度計算

使用案例

自然語言處理

語義搜索

可用於構建中文語義搜索引擎，通過向量相似度匹配相關文檔。

問答系統

用於計算問題和候選答案之間的語義相似度。

文本聚類

通過文本向量化實現文檔自動分類和聚類。

屬性	詳情
模型類型	句子相似度模型
標籤	text2vec、特徵提取、句子相似度、transformers

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Text2vec Base Chinese

模型概述

模型特點

模型能力

使用案例

🚀 文本向量模型

🚀 快速開始

📢 最新消息

📄 許可證