C

Chonky Modernbert Base 1

Developed by mirth
Chonky是一款能智能將文本分割成有意義語義塊的Transformer模型,可用於RAG系統。
Downloads 221
Release Time : 4/14/2025

Model Overview

該模型處理文本並將其劃分為語義連貫的片段,這些分塊可作為RAG流程的一部分輸入到基於嵌入的檢索系統或語言模型中。

Model Features

語義分塊
能夠智能地將文本分割成有意義的語義塊,保持語義連貫性
長序列支持
基於ModernBERT架構,原生支持最長8192的序列長度
RAG優化
專為RAG(檢索增強生成)系統設計,優化了分塊質量

Model Capabilities

文本分割
語義分析
段落劃分

Use Cases

信息檢索
RAG系統預處理
為檢索增強生成系統準備語義連貫的文本塊
提高檢索效率和相關性
文本處理
文檔分塊
將長文檔分割成有意義的段落
便於後續處理和分析
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase