C

Chonky Modernbert Large 1

由mirth開發
Chonky是一款能夠智能地將文本分割成有意義的語義塊的Transformer模型,適用於RAG系統。
下載量 54
發布時間 : 4/26/2025

模型概述

該模型處理文本並將其劃分為語義連貫的片段,這些分塊可以作為RAG流程的一部分,輸入到基於嵌入的檢索系統或語言模型中。

模型特點

智能語義分塊
能夠將文本分割成有意義的語義塊,保持內容的連貫性。
RAG系統優化
專為檢索增強生成(RAG)系統設計,優化了分塊質量。
長序列支持
在長度為1024的序列上進行了微調(基礎模型支持最長8192的序列)。

模型能力

文本語義分塊
段落分割
RAG系統預處理

使用案例

信息檢索
RAG系統預處理
為檢索增強生成系統準備語義連貫的文本塊
提高檢索系統的準確性和相關性
文本處理
文檔分割
將長文檔分割成有意義的段落
便於後續處理和分析
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase