Typhoon Ocr 7b
タイ・英語バイリンガルの現実世界文書解析のために特別に設計された視覚言語モデル、Qwen2.5-VL-Instructionフレームワークベース
画像生成テキスト
Transformers 複数言語対応

T
scb10x
126
9
Qwen Vl 2.5 3B Finetuned Cheque
ビジュアル言語モデルで、小切手画像から構造化された金融情報を抽出し、小切手番号、受取人、金額、発行日などの重要な情報を含むJSON形式の出力を生成することに特化しています。
画像生成テキスト
Transformers 英語

Q
AJNG
170
1
Qwen2 VL 2B OCR
Apache-2.0
Qwen2-VL-2B-OCRはunsloth/Qwen2-VL-2B-Instructを微調整したOCRモデルで、文書、表、給与明細画像から完全なテキストを抽出することに特化しています。
画像生成テキスト
Transformers 英語

Q
JackChew
842
4
Sk Invoice Receipts
Apache-2.0
Donutアーキテクチャをファインチューニングした実験用モデルで、請求書や領収書の画像をXMLまたはJSONデータ構造に変換するために特別に設計されており、従来のOCRエンジンを必要としません。
画像生成テキスト
Transformers

S
selvakumarcts
201
39
Invoice And Receipts Donut V1
Apache-2.0
Donutアーキテクチャに基づく大規模言語モデルで、請求書や領収書の画像を構造化データに変換するために設計
画像生成テキスト
Transformers

I
mychen76
2,945
54
Tatr Tab Struct V2
PubTables1MとFinTabNetデータセットで訓練されたDETRアーキテクチャモデルで、表構造認識タスク専用
文字認識
Transformers

T
deepdoctection
99
2
Donut Base Payslips
MIT
Donutアーキテクチャに基づく文書理解モデルで、給与明細画像処理に特化してファインチューニング
文字認識
Transformers

D
Assadullah
20
0
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98