C

Chonky Distilbert Base Uncased 1

由mirth開發
Chonky是一款能夠智能地將文本分割成有意義的語義塊的Transformer模型,適用於RAG系統。
下載量 1,486
發布時間 : 4/10/2025

模型概述

該模型處理文本並將其劃分為語義連貫的片段,這些分塊可作為RAG流程的一部分輸入到基於嵌入的檢索系統或語言模型中。

模型特點

智能語義分塊
能夠將文本智能地分割成有意義的語義塊,提高RAG系統的效率。
基於DistilBERT
使用輕量級的DistilBERT-base-uncased模型,平衡了性能和效率。
易於集成
提供了專門的Python庫和標準NER流程兩種使用方式。

模型能力

文本分割
語義分析
RAG系統支持

使用案例

信息檢索
RAG系統預處理
為基於嵌入的檢索系統準備語義連貫的文本塊
提高檢索相關性和效率
文本處理
文檔分割
將長文檔分割成有意義的段落
便於後續分析和處理
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase