# ゼロショット適応

Instructcir Llava Phi35 Clip224 Lp
Apache-2.0
InstructCIRは命令認識型対照学習に基づく組み合わせ式画像検索モデルで、ViT-L-224とPhi-3.5-Miniアーキテクチャを採用し、画像テキストからテキスト生成タスクに特化しています。
画像生成テキスト
I
uta-smile
15
2
Linfusion XL
LinFusionは拡散モデルベースのテキストから画像生成モデルで、入力されたテキスト記述に基づき高品質な画像を生成できます。
テキスト生成画像
L
Yuanshi
37
7
Cogflorence 2.2 Large
MIT
このモデルはmicrosoft/Florence-2-largeのファインチューニング版で、Ejafa/ye-popデータセットの4万枚の画像サブセットで訓練され、アノテーションテキストはTHUDM/cogvlm2-llama3-chat-19Bによって生成され、画像からテキストへのタスクに適しています。
画像生成テキスト Transformers 複数言語対応
C
thwri
20.64k
33
L3 SthenoMaidBlackroot 8B V1
これはmergekitツールを使用してマージされた8Bパラメータ規模の言語モデルで、Sao10K/L3-8B-Stheno-v3.2をベースモデルとして、Jamet-8B-L3とLlama-3-Lumimaid-8Bの特性を融合させています
大規模言語モデル Transformers
L
bluuwhale
163
25
Gliner Ko
GLiNERは固有表現認識(NER)モデルで、あらゆるエンティティタイプを認識でき、従来のNERモデルに代わる実用的なソリューションを提供します。
シーケンスラベリング PyTorch 韓国語
G
taeminlee
165
11
Hkjk
MIT
AllenNLPライブラリに基づくテキストからビデオを生成するモデルで、入力されたテキスト記述に応じて対応するビデオコンテンツを生成できます。
テキスト生成ビデオ
H
MileAway
0
0
Slimsam Uniform 77
Apache-2.0
SlimSAMは革新的なSAMモデル圧縮手法で、統一プルーニング-蒸留フレームワークにより事前学習済みSAMを効率的に再利用でき、大量の再訓練を必要としません。
画像セグメンテーション Transformers その他
S
Zigeng
18.82k
24
Whisper Large V2 Onnx Int4 Inc
Apache-2.0
Whisperは事前学習済みの自動音声認識(ASR)および音声翻訳モデルで、68万時間の注釈付きデータでトレーニングされ、強力な汎化能力を示しています。このリポジトリには、ONNX形式のWhisper large v2モデルのINT4重みのみ量子化バージョンが含まれています。
音声認識 Transformers
W
Intel
19
27
Polsk
このモデルはテキスト記述を動画コンテンツに変換でき、様々なクリエイティブや自動化シナリオに適用可能です。
テキスト生成ビデオ
P
Tyffuss86
0
0
Thinksites
MIT
これはテキストからビデオを生成するモデルで、入力されたテキストの説明を対応するビデオコンテンツに変換できます。
テキスト生成ビデオ
T
thinkamconnect
0
0
Autotrain Classify 42751109216
これはAutoTrainでトレーニングされた二項分類画像分類モデルで、完璧な検証指標のパフォーマンスを発揮します。
画像分類 Transformers
A
vevlins
16
0
Astrophotography Object Classifier Alpha4
これはAutoTrainでトレーニングされた天体写真オブジェクト分類モデルで、天体写真中の様々な天体オブジェクトを正確に識別できます。
画像分類 Transformers
A
bortle
16
0
Autotrain Animals Vs Humans2 37846100283
これはAutoTrainでトレーニングされた二項分類モデルで、動物と人間の画像を区別するために特別に設計されています。
画像分類 Transformers
A
hg2001
16
1
Autotrain Selenophake 3668397922
これはAutoTrainでトレーニングされた二値分類視覚モデルで、画像分類タスク専用です。
画像分類 Transformers
A
CharlemagneDeer
17
0
Autotrain Cat Vs Dog 3608196590
AutoTrainでトレーニングされた二項分類モデルで、猫と犬の画像を区別するために特別に設計されています
画像分類 Transformers
A
Kluuking
17
0
Kebersihan Jalan Detection
環境の清潔度を分類するための視覚モデルで、画像中の汚れや乱雑さ、清潔なシーンを識別可能
画像分類 Transformers
K
asaderu-ai
37
0
Autotrain Mm 2927885005
これはAutoTrainでトレーニングされた二値分類視覚モデルで、2種類の画像を正確に区別できます。
画像分類 Transformers
A
swww
18
0
Autotrain Test Auto Nlp 2885884378
これはAutoTrainでトレーニングされた二値分類モデルで、画像分類タスク専用です。
画像分類 Transformers
A
owsgfwnlgjuz
16
0
Instructor Large
Apache-2.0
INSTRUCTOR-Largeは汎用埋め込みモデルで、任意のテキスト断片を固定長のベクトルにマッピングでき、命令制御によりドメイン特異性とタスク認識性を実現します。
テキスト埋め込み Transformers 英語
I
hku-nlp
66
2
Instructor Base
Apache-2.0
これは汎用埋め込みモデルで、命令誘導によりドメイン固有かつタスク認識の埋め込みベクトルを生成でき、様々なテキスト処理タスクに適用可能です。
テキスト埋め込み Transformers 英語
I
hku-nlp
56
6
Autotrain Cat Vs Dogs 1858163503
これはAutoTrainを使用してトレーニングされた二項分類モデルで、猫と犬の画像を区別するために特別に設計されています。
画像分類 Transformers
A
kem000123
10
2
Autotrain Dogs And Cats 1527055142
AutoTrainでトレーニングされた二項分類モデルで、猫と犬の画像を正確に区別できます
画像分類 Transformers
A
omarques
34
2
Mvp Multi Task
Apache-2.0
MVPマルチタスクモデルはプロンプトベースの事前学習モデルで、混合アノテーションデータセットによる最適化を経ており、様々な自然言語生成タスク向けに設計されています。
大規模言語モデル Transformers 複数言語対応
M
RUCAIBox
20
2
Wav2vec2large Xlsr Akan
これは汎用の音声モデルで、音声認識と音声処理タスクをサポートします。
音声認識 その他
W
azunre
2,834
0
Wav2vec2 Large Xlsr 53 Vietnamese
OpenAIが開発した効率的な汎用大規模言語モデル、様々な自然言語処理タスクに適応
大規模言語モデル Transformers
W
WSS
22
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase