Jedi 7B 1080p GGUF
Apache-2.0
Transformerアーキテクチャに基づく画像テキストからテキストを生成するモデルで、コンピュータ/GUI関連のシーン向けに設計され、インテリジェントエージェント機能を備えています。
テキスト生成画像 英語
J
lmstudio-community
113
1
Smolvlm 500M Anime Caption V0.2
Apache-2.0
アニメスタイルの画像記述に特化した視覚言語モデル、SmolVLM-500M-Baseをファインチューニング
画像生成テキスト
Safetensors 英語
S
Andres77872
17
0
Smartshot Zeroshot Finetuned V0.1.2
MIT
roberta-base-zeroshot-v2.0-cをベースにSmartShot手法と合成データで性能向上を図ったゼロショット分類モデル
テキスト分類 その他
S
gincioks
119
0
Smolvlm 500M Anime Caption V0.1
Apache-2.0
アニメスタイル画像の記述に特化した視覚言語モデル。SmolVLM-500M-Baseをファインチューニングし、大規模言語モデルで生成された18万組の合成画像/字幕ペアでトレーニング。
画像生成テキスト 英語
S
Andres77872
61
0
Cockatiel 8B
VILA-v1.5-8Bを基に構築された動画字幕生成モデルで、入力動画に対して詳細かつ人間の嗜好に合致する字幕を生成できます。
ビデオ生成テキスト
Transformers

C
Fr0zencr4nE
19
0
Poseless 3B
Apache-2.0
PoseLessは、明示的な姿勢推定を必要とせず、投影表現を使用して2D画像を直接関節角度にマッピングする革新的なロボットハンド制御フレームワークです。
マルチモーダル融合
Transformers

P
homebrewltd
98
7
Gliner Biomed Bi Large V1.0
Apache-2.0
GLiNER-BioMedはGLiNERフレームワークに基づく、生物医学分野向けに設計された効率的なオープンNERモデルスイートで、さまざまな種類の生物医学エンティティを認識できます。
シーケンスラベリング 英語
G
Ihor
56
1
Gliner Biomed Bi Base V1.0
Apache-2.0
GLiNER-BioMedはGLiNERフレームワークに基づく効率的なオープンバイオメディカル固有表現認識モデルスイートで、バイオメディカル分野向けに設計されており、さまざまなエンティティタイプを認識できます。
シーケンスラベリング 英語
G
Ihor
25
1
Gliner Biomed Large V1.0
Apache-2.0
GLiNER-BioMedはGLiNERフレームワークに基づく専門的な効率的なオープンバイオメディカルNERモデルスイートで、バイオメディカルエンティティ認識タスクにおいて最先端のゼロショットおよび少数ショット性能を実現しています。
シーケンスラベリング
PyTorch 英語
G
Ihor
163
6
Gliner Biomed Base V1.0
Apache-2.0
GLiNER-生物医学版はGLiNERフレームワークを基に開発された専門的な生物医学固有表現認識モデルで、様々な生物医学エンティティタイプを識別できます。
シーケンスラベリング
PyTorch 英語
G
Ihor
61
2
Asagi 8B
Apache-2.0
Asagi-8Bは大規模な日本語視覚言語モデル(VLM)で、広範な日本語データセットに基づいて訓練され、多様なデータソースを統合しています。
画像生成テキスト
Transformers 日本語

A
MIL-UT
58
4
Slam Scaled
MIT
単一GPUで24時間以内にトレーニングされた高品質な音声言語モデル、Qwen2.5-0.5Bを微調整、Hubertトークンを語彙として使用
音声生成
Transformers

S
slprl
792
6
Modernbert Large Bias Type Classifier
MIT
ModernBERT-largeをファインチューニングしたテキスト分類モデルで、テキスト内のさまざまなバイアスタイプを検出・分類します。
テキスト分類
Transformers 英語

M
cirimus
424
2
Asagi 14B
Apache-2.0
Asagi-14Bは大規模な日本語視覚言語モデル(VLM)で、幅広い日本語データセットでトレーニングされ、多様なデータソースを統合しています。
画像生成テキスト
Transformers 日本語

A
MIL-UT
83
9
Flux.1 Dev Controlnet Upscaler
その他
Jasper研究チームによって開発された低解像度画像のスケールアップ用ControlNetモデル
画像の拡張
F
R1000
106
3
Multilingual Sentiment Analysis
DistilBERTをファインチューニングした多言語感情分析モデルで、21言語をサポートし、ソーシャルメディアや顧客フィードバックなど多様なシナリオの分析に適しています。
テキスト分類
Transformers 複数言語対応

M
tabularisai
162.07k
145
Euclid Convnext Xxlarge 120524
Apache-2.0
低レベルの幾何知覚能力を強化するために特別に訓練されたマルチモーダル大規模言語モデル。高忠実度の視覚記述を合成することで幾何解析能力を向上
テキスト生成画像
Transformers 英語

E
euclid-multimodal
22
4
Gec Spanish BARTO SYNTHETIC
BARTアーキテクチャに基づくスペイン語文法チェックモデル。COWS-L2Hデータセットと80,984件の合成データでトレーニングされ、単文チェックに最適化
テキスト生成
Transformers 複数言語対応

G
SkitCon
118
1
Mstyledistance
MIT
mStyleDistanceは多言語スタイル埋め込みモデルで、類似した執筆スタイルのテキストを密に埋め込み、異なるスタイルのテキストを遠くに埋め込むことを目的としており、コンテンツや言語の制約を受けません。
テキスト埋め込み
M
StyleDistance
207
2
Pegasus X Base Synthsumm Open 16k
Apache-2.0
pegasus-x-baseをファインチューニングしたテキスト要約モデルで、合成データを使用してトレーニングされ、長文書の要約タスクに優れています。
テキスト生成
Transformers 英語

P
BEE-spoke-data
115
2
Depth Anything V2 Metric Outdoor Large Hf
Apache-2.0
Depth Anything V2を屋外メトリック深度推定タスク向けにファインチューニングしたバージョンで、合成データセットVirtual KITTIを使用してトレーニング
3Dビジョン
Transformers

D
depth-anything
3,662
6
Robust Sentiment Analysis
Apache-2.0
distilbert/distilbert-base-uncasedをファインチューニングした感情分析モデルで、合成データのみでトレーニングされ、5つの感情分類をサポートします。
テキスト分類
Transformers 英語

R
tabularisai
2,632
14
Gliclass Base V1.0
Apache-2.0
GLiClassは効率的なゼロショット分類器で、GLiNERに触発され、テキスト分類、感情分析、およびRAGプロセスにおける再ランキングタスクに適しています。
テキスト分類
Transformers 英語

G
knowledgator
152
3
Qwen2 1.5B Summarize
Apache-2.0
Qwen2-1.5B-Instructモデルを基に2回の微調整を行った要約生成専用モデル
テキスト生成
Transformers 英語

Q
thepowerfuldeez
228
1
Trocr Base Ru
Apache-2.0
TrOCR-Ruは、microsoft/trocr-base-handwrittenをロシア語と英語の合成データセットでファインチューニングした光学文字認識モデルで、画像からテキストへの変換タスクに特化しています。
文字認識
Transformers 複数言語対応

T
sherstpasha99
30
0
T5 Base Spell Correction Fr
MIT
このモデルはT5アーキテクチャに基づいており、フランス語テキストのスペルミスや句読点の誤りを修正するために特別に設計されています。
テキスト生成
Transformers フランス語

T
fdemelo
249
2
Zephyr 7b Gemma V0.1
その他
Zephyr 7B Gemmaはgoogle/gemma-7bをファインチューニングした言語モデルで、公開合成データセットで直接選好最適化(DPO)を使用して訓練され、有用なアシスタントとして設計されています。
大規模言語モデル
Transformers

Z
HuggingFaceH4
502
124
Trocr Base Ru
Apache-2.0
microsoft/trocr-base-handwrittenをファインチューニングしたロシア語と英語のOCRモデルで、手書きと印刷テキストの認識に特化
文字認識
Transformers 複数言語対応

T
raxtemur
977
26
Ko Deplot
Apache-2.0
ko-deplotはGoogleのPix2Structアーキテクチャに基づく韓国語視覚的質問応答モデルで、Deplotモデルを微調整してトレーニングされ、韓国語と英語のチャート画像質問応答タスクをサポートします。
画像生成テキスト
Transformers 複数言語対応

K
nuua
252
5
Orca 2 13b
その他
Orca 2はマイクロソフトが開発した研究用言語モデルで、小型言語モデルの推論能力向上に焦点を当てています。
大規模言語モデル
Transformers

O
microsoft
11.10k
666
Orca 2 7b
その他
Orca 2はマイクロソフトが開発した研究用言語モデルで、小型言語モデルの推論能力向上に焦点を当て、LLAMA-2をファインチューニングして作成されました。
大規模言語モデル
Transformers

O
microsoft
120.21k
219
7B
70億パラメータの因果言語モデルで、Meta LLaMA 2アーキテクチャと互換性があり、複数の評価で同クラスの330億パラメータ以下のモデルを上回る性能を発揮
大規模言語モデル
Transformers 複数言語対応

7
CausalLM
177
135
Phi Hermes 1.3B
その他
HermesデータセットでファインチューニングされたPhi-1.5モデル、主にテキスト生成タスクに使用
大規模言語モデル
Transformers 英語

P
teknium
45
44
Donutlicenses3v3
MIT
このモデルはEU運転免許証画像から構造化情報を抽出し、JSON形式で結果を返します。
文字認識
Transformers 英語

D
felipebandeira
54
5
Esm2 T6 8M UR50D Sequence Classifier V1
MIT
ESM-2タンパク質言語モデルに基づいてトレーニングされた小型配列分類器で、タンパク質配列を酵素、受容体タンパク質、構造タンパク質の3種類に分類できます。
タンパク質モデル
Transformers 英語

E
AmelieSchreiber
30
0
Trocr Small Korean
Apache-2.0
TrOCRは視覚エンコーダ-デコーダアーキテクチャに基づく韓国語画像からテキストへの変換モデルで、DeiTを画像エンコーダ、RoBERTaをテキストデコーダとして使用しています。
画像生成テキスト 韓国語
T
team-lucid
342
17
Airoboros 13b
これはLlaMaアーキテクチャを基にした130億パラメータの言語モデルで、合成データを用いてファインチューニングされ、主に研究目的で使用されます。
大規模言語モデル
Transformers

A
jondurbin
229
107
Trocr Base Printed Synthetic Dataset Ocr
microsoft/trocr-base-printedをファインチューニングした印刷テキスト認識モデル、合成OCRデータセットに最適化
文字認識
Transformers 英語

T
DunnBC22
65
1
Pythia 2.8b Deduped Synthetic Instruct
Apache-2.0
Pythia-2.8Bの重複排除バージョンを基にした命令生成モデルで、合成命令データセットに最適化されています
大規模言語モデル
Transformers 英語

P
lambdalabs
46
6
Electra Large Synqa
Apache-2.0
ELECTRA-Largeアーキテクチャに基づく2段階トレーニング質問応答モデル。最初に合成敵対データでトレーニングし、その後SQuADとAdversarialQAデータセットで微調整
質問応答システム
Transformers 英語

E
mbartolo
24
3
- 1
- 2
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98