Text2vec Base Chinese
基於shibing624/text2vec-base-chinese的衍生模型,將MacBERT替換為LERT,並保持其他訓練條件不變,支持中文文本向量化和句子相似度計算。
下載量 1,613
發布時間 : 3/7/2023
模型概述
該模型是一箇中文文本向量化模型,主要用於特徵提取和句子相似度計算。它是基於shibing624/text2vec-base-chinese的改進版本,將原始架構中的MacBERT替換為LERT,同時保持其他訓練條件不變。
模型特點
LERT架構
將原始模型中的MacBERT替換為LERT,可能帶來更好的性能或效率。
ONNX支持
提供ONNX運行時版本,便於在不同平臺上部署和推理。
中文優化
專門針對中文文本進行優化,適合中文自然語言處理任務。
模型能力
文本向量化
特徵提取
句子相似度計算
使用案例
自然語言處理
語義搜索
可用於構建中文語義搜索引擎,通過向量相似度匹配相關文檔。
問答系統
用於計算問題和候選答案之間的語義相似度。
文本聚類
通過文本向量化實現文檔自動分類和聚類。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98