Magi
漫画解読者は、漫画内のテキストと画像要素を自動的に認識し、対応する転写テキストを生成する自動転写生成システムです。
ダウンロード数 2,575
リリース時間 : 1/18/2024
モデル概要
このシステムは、物体検出、光学文字認識(OCR)、クラスタリング分析技術を組み合わせており、漫画画像を自動処理し、テキスト内容を抽出して構造化された転写を生成できます。
モデル特徴
マルチモーダル処理
画像とテキスト情報を同時に処理し、漫画内容の包括的な解析を実現
自動転写生成
漫画内容のテキスト転写を自動生成可能
視覚化結果
検出結果の視覚的な出力を提供
モデル能力
漫画画像分析
テキスト検出
光学文字認識(OCR)
内容転写生成
結果視覚化
使用事例
デジタル漫画処理
漫画デジタル化
紙の漫画を検索可能なデジタル形式に変換
構造化されたテキスト転写を生成
漫画内容分析
漫画内のテキスト内容とレイアウトを分析
主要な会話とシーン情報を抽出
支援技術
視覚障害者支援
視覚障害ユーザーに漫画内容のテキスト説明を提供
漫画内容のアクセシビリティ向上
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98