C

Chonky Modernbert Large 1

mirthによって開発
Chonkyはテキストを意味のあるセマンティックブロックにインテリジェントに分割できるTransformerモデルで、RAGシステムに適しています。
ダウンロード数 54
リリース時間 : 4/26/2025

モデル概要

このモデルはテキストを処理し、意味的に一貫したセグメントに分割します。これらのチャンクはRAGプロセスの一部として、埋め込みベースの検索システムや言語モデルに入力できます。

モデル特徴

インテリジェントなセマンティックチャンキング
テキストを意味のあるセマンティックブロックに分割し、内容の一貫性を保持できます。
RAGシステム最適化
検索拡張生成(RAG)システム向けに設計され、チャンク品質を最適化しています。
長いシーケンスのサポート
長さ1024のシーケンスで微調整されています(ベースモデルは最大8192のシーケンスをサポート)。

モデル能力

テキストセマンティックチャンキング
段落分割
RAGシステム前処理

使用事例

情報検索
RAGシステム前処理
検索拡張生成システム向けに意味的に一貫したテキストブロックを準備
検索システムの精度と関連性を向上
テキスト処理
ドキュメント分割
長文ドキュメントを意味のある段落に分割
後続の処理と分析を容易にする
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase