Visionocr 3B 061125 GGUF
Apache-2.0
Qwen2.5-VL-3B-Instructをベースに微調整されたビジュアルOCRモデルで、ドキュメントレベルのOCR、長文脈の視覚言語理解、数学のLaTeX形式変換に特化しています。
画像生成テキスト
Transformers 英語

V
prithivMLmods
131
1
Docscopeocr 7B 050425 Exp
Apache-2.0
docscopeOCR-7B-050425-expは、Qwen/Qwen2.5-VL-7B-Instructをベースに微調整されたモデルで、ドキュメントレベルのOCR、長文脈のビジュアル言語理解、および数学のLaTeX形式の正確な画像からテキストへの変換に特化しています。
画像生成テキスト
Transformers 複数言語対応

D
prithivMLmods
531
2
Coreocr 7B 050325 Preview
Apache-2.0
coreOCR-7B-050325-previewは、Qwen/Qwen2-VL-7Bをベースに微調整された視覚言語モデルで、ドキュメントレベルのOCR、長文脈の視覚言語理解、および正確な画像からテキストへの変換(数学LaTeX形式をサポート)に特化しています。
画像生成テキスト
Transformers 英語

C
prithivMLmods
1,532
4
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98