C

Chonky Distilbert Base Uncased 1

mirthによって開発
Chonkyは、テキストを意味のある意味分塊に賢く分割できるTransformerモデルで、RAGシステムに適しています。
ダウンロード数 1,486
リリース時間 : 4/10/2025

モデル概要

このモデルはテキストを処理し、意味的に一貫した断片に分割します。これらの分塊は、RAGプロセスの一部として、埋め込みベースの検索システムまたは言語モデルに入力できます。

モデル特徴

賢い意味分塊
テキストを意味のある意味分塊に賢く分割し、RAGシステムの効率を向上させます。
DistilBERTベース
軽量のDistilBERT-base-uncasedモデルを使用し、性能と効率をバランスさせます。
統合が容易
専用のPythonライブラリと標準のNERプロセスの2つの使用方法を提供します。

モデル能力

テキスト分割
意味分析
RAGシステムサポート

使用事例

情報検索
RAGシステムの前処理
埋め込みベースの検索システム用に意味的に一貫したテキストブロックを準備する
検索の関連性と効率を向上させる
テキスト処理
ドキュメント分割
長いドキュメントを意味のある段落に分割する
後続の分析と処理を容易にする
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase