# マルチシーン対応

Vitpose Plus Huge
Apache-2.0
ViTPose++はビジョントランスフォーマーを基盤とした人体姿勢推定の基本モデルで、MS COCOキーポイントテストセットで81.1 APという優れた性能を達成しました。
姿勢推定 Transformers
V
usyd-community
14.49k
6
Negclip
MIT
オープンクリップは、微調整なしで画像を分類できるゼロショット画像分類モデルです。
画像分類
N
Nano1337
92
0
Detr Gui Component Detection V0
MIT
MITライセンスに基づくオープンソースモデル、詳細情報は現在利用不可
大規模言語モデル Transformers
D
rawhad
16
1
Yolov10n
YOLOv10は清華大学が提案したリアルタイムエンドツーエンド物体検出モデルで、効率的かつ正確な特徴を持っています。
物体検出
Y
jameslahm
3,326
17
Detr Face Detection
Openrail
creativeml-openrail-mライセンスに基づく顔検出モデルで、英語をサポートし、主に物体検出タスクに使用されます。
物体検出 Transformers 英語
D
diffusionai
108
1
Yolov10s
YOLOv10は清華大学MIG研究所が開発した高効率なリアルタイム物体検出モデルで、エンドツーエンド検出機能を提供します。
物体検出 Transformers
Y
onnx-community
13
7
Juggernaut XL V9
Openrail
Stable Diffusion XLをベースにした強化版画像生成モデル、高精度な写真スタイルの出力に特化
画像生成 複数言語対応
J
RunDiffusion
163.53k
195
Parrots Chinese Roberta Wwm Ext Large
Apache-2.0
RoBERTaアーキテクチャに基づく中国語事前学習モデル、テキスト音声変換タスクをサポート
大規模言語モデル Transformers 中国語
P
shibing624
76
2
Prompt Generator
大規模言語モデル(LLM)向けに設計されたプロンプト生成ツールで、ユーザーが効果的なテキストプロンプトを迅速に作成できるように支援します。
大規模言語モデル Transformers 英語
P
ByteWave
99
23
Llama 2 70B Chat GGUF
Llama 2 70B ChatはMetaが開発した700億パラメータの大規模言語モデルで、対話タスクに最適化されています。
大規模言語モデル 英語
L
TheBloke
3,578
123
Gpt4chan Model Float16
MIT
大規模言語モデル Transformers
G
pawelppppaolo
21
9
Kecerdasan Buatan
Gpl-3.0
GPL-3.0ライセンスに基づくオープンソースAIプロジェクトで、具体的な機能はモデルタイプに依存します
大規模言語モデル Transformers
K
Yuuki0
18
0
Autotrain Multifamily V2 3736899404
これはAutoTrainでトレーニングされたマルチクラス画像分類モデルで、検証セットで78.6%の精度を達成しました。
画像分類 Transformers
A
lineups-io
14
0
Everything V1
Openrail
Anything V3をファインチューニングしたアニメスタイルのStable Diffusionモデルで、danbooruタグを使用した高品質画像生成に対応
画像生成 英語
E
TheRafal
90
12
Waynehills STT Doogie Server
Apache-2.0
Doogie/Waynehills-STT-doogie-serverをファインチューニングした音声認識モデル
音声認識 Transformers
W
Waynehillsdev
28
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase