C

Chonky Modernbert Base 1

mirthによって開発
Chonkyはテキストを意味のあるセマンティックブロックに分割するTransformerモデルで、RAGシステムに使用可能です。
ダウンロード数 221
リリース時間 : 4/14/2025

モデル概要

このモデルはテキストを処理し、意味的に一貫したセグメントに分割します。これらのチャンクはRAGプロセスの一部として、埋め込みベースの検索システムや言語モデルに入力できます。

モデル特徴

セマンティックチャンキング
テキストを意味のあるセマンティックブロックに分割し、意味的一貫性を保持
長系列サポート
ModernBERTアーキテクチャに基づき、最大8192の系列長をネイティブサポート
RAG最適化
RAG(検索拡張生成)システム向けに設計され、チャンク品質を最適化

モデル能力

テキスト分割
意味解析
段落分割

使用事例

情報検索
RAGシステム前処理
検索拡張生成システム向けに意味的に一貫したテキストブロックを準備
検索効率と関連性の向上
テキスト処理
文書チャンキング
長文書を意味のある段落に分割
後続処理と分析の容易化
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase