モデル選定

金融書類処理

# 金融書類処理

OCR NumInput Base

印刷数字およびタイムスタンプ類の数値に最適化されたOCRモデルで、単一行画像テストセットでCER=0の認識精度を実現

Transformers 英語

OCR TextInput Base

金融分野に特化した画像からテキストへの変換モデルで、英文テキスト認識をサポートし、主に金融文書の画像内容を処理します。

Transformers 英語

Donut Base Finetuned Cord V2

DonutはSwin Transformerベースの視覚的文書理解モデルで、CORDデータセットに特化してファインチューニングされており、画像から構造化されたテキスト情報を抽出できます。

画像生成テキスト

e13b MICRコードの転写に特化したOCRモデルで、MicrosoftのTrOCR-large-stage1をファインチューニングしたものです。

Transformers 英語

これはCORD-v2データセットでファインチューニングされたDonutモデルで、画像からテキストへの変換タスク向けに設計されており、平均精度は0.901です。

画像生成テキスト

OCR LayoutLMv3 Invoice

LayoutLMv3-baseをファインチューニングした請求書認識モデルで、wild_receiptデータセットで訓練され、請求書から構造化情報を抽出するのに優れています。

シーケンスラベリング

Layoutlmv3 Cord Ner

LayoutLMv3-baseをファインチューニングした文書理解モデルで、CORDデータセットにおける固有表現認識タスク専用

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase