CRAFT
CRAFTは多言語テキスト検出モデルで、画像内のテキスト領域を検出するために設計されており、特にペルシャ語テキスト検出に適していますが、他の言語もサポートしています。
ダウンロード数 11.22k
リリース時間 : 7/4/2024
モデル概要
CRAFTは文字領域認識に基づくテキスト検出モデルで、画像内のテキスト位置を正確に識別できます。このモデルは主に多言語テキスト検出に使用され、特にペルシャ語向けに最適化されていますが、他の言語のテキスト検出タスクにも適用可能です。
モデル特徴
多言語サポート
ペルシャ語や英語など、複数言語のテキスト検出をサポートします。
文字領域認識
文字レベルの領域認識により、テキスト検出の精度を向上させます。
Hezarフレームワーク互換
Hezarフレームワークと完全互換で、統合と使用が容易です。
モデル能力
テキスト検出
多言語サポート
画像解析
使用事例
ドキュメント処理
ドキュメントスキャン
ドキュメント内のテキスト領域をスキャンし、後のOCR処理を容易にします。
ドキュメント内のテキスト位置を正確に検出します。
自然シーンテキスト検出
街景テキスト認識
自然シーン(街景など)内のテキストを検出します。
画像内のテキスト領域を識別し位置特定します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98