CRAFTオープンソース多言语文本検出モデル - 無料でデプロイし、画像中のテキスト領域を高精度に識別

ホーム

CRAFT

hezaraiによって開発

CRAFTは多言語テキスト検出モデルで、画像内のテキスト領域を検出するために設計されており、特にペルシャ語テキスト検出に適していますが、他の言語もサポートしています。

文字認識複数言語対応#多言語テキスト検出 #文字領域認識 #ペルシャ語最適化

ダウンロード数 11.22k

リリース時間 : 7/4/2024

モデル概要

CRAFTは文字領域認識に基づくテキスト検出モデルで、画像内のテキスト位置を正確に識別できます。このモデルは主に多言語テキスト検出に使用され、特にペルシャ語向けに最適化されていますが、他の言語のテキスト検出タスクにも適用可能です。

モデル特徴

多言語サポート

ペルシャ語や英語など、複数言語のテキスト検出をサポートします。

文字領域認識

文字レベルの領域認識により、テキスト検出の精度を向上させます。

Hezarフレームワーク互換

Hezarフレームワークと完全互換で、統合と使用が容易です。

モデル能力

テキスト検出

多言語サポート

画像解析

使用事例

ドキュメント処理

ドキュメントスキャン

ドキュメント内のテキスト領域をスキャンし、後のOCR処理を容易にします。

ドキュメント内のテキスト位置を正確に検出します。

自然シーンテキスト検出

街景テキスト認識

自然シーン（街景など）内のテキストを検出します。

画像内のテキスト領域を識別し位置特定します。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

CRAFT

モデル概要

モデル特徴

モデル能力

使用事例

🚀 CRAFT: Character-Region Awareness For Text detection

🚀 クイックスタート

📦 インストール

💻 使用例

基本的な使用法