モデル選定

ゼロショット適応

# ゼロショット適応

Instructcir Llava Phi35 Clip224 Lp

InstructCIRは命令認識型対照学習に基づく組み合わせ式画像検索モデルで、ViT-L-224とPhi-3.5-Miniアーキテクチャを採用し、画像テキストからテキスト生成タスクに特化しています。

画像生成テキスト

LinFusionは拡散モデルベースのテキストから画像生成モデルで、入力されたテキスト記述に基づき高品質な画像を生成できます。

テキスト生成画像

Cogflorence 2.2 Large

このモデルはmicrosoft/Florence-2-largeのファインチューニング版で、Ejafa/ye-popデータセットの4万枚の画像サブセットで訓練され、アノテーションテキストはTHUDM/cogvlm2-llama3-chat-19Bによって生成され、画像からテキストへのタスクに適しています。

画像生成テキスト

Transformers 複数言語対応

L3 SthenoMaidBlackroot 8B V1

これはmergekitツールを使用してマージされた8Bパラメータ規模の言語モデルで、Sao10K/L3-8B-Stheno-v3.2をベースモデルとして、Jamet-8B-L3とLlama-3-Lumimaid-8Bの特性を融合させています

大規模言語モデル

GLiNERは固有表現認識（NER）モデルで、あらゆるエンティティタイプを認識でき、従来のNERモデルに代わる実用的なソリューションを提供します。

シーケンスラベリング

PyTorch 韓国語

AllenNLPライブラリに基づくテキストからビデオを生成するモデルで、入力されたテキスト記述に応じて対応するビデオコンテンツを生成できます。

テキスト生成ビデオ

Slimsam Uniform 77

SlimSAMは革新的なSAMモデル圧縮手法で、統一プルーニング-蒸留フレームワークにより事前学習済みSAMを効率的に再利用でき、大量の再訓練を必要としません。

画像セグメンテーション

Transformers その他

Whisper Large V2 Onnx Int4 Inc

Whisperは事前学習済みの自動音声認識（ASR）および音声翻訳モデルで、68万時間の注釈付きデータでトレーニングされ、強力な汎化能力を示しています。このリポジトリには、ONNX形式のWhisper large v2モデルのINT4重みのみ量子化バージョンが含まれています。

このモデルはテキスト記述を動画コンテンツに変換でき、様々なクリエイティブや自動化シナリオに適用可能です。

テキスト生成ビデオ

これはテキストからビデオを生成するモデルで、入力されたテキストの説明を対応するビデオコンテンツに変換できます。

テキスト生成ビデオ

Autotrain Classify 42751109216

これはAutoTrainでトレーニングされた二項分類画像分類モデルで、完璧な検証指標のパフォーマンスを発揮します。

Astrophotography Object Classifier Alpha4

これはAutoTrainでトレーニングされた天体写真オブジェクト分類モデルで、天体写真中の様々な天体オブジェクトを正確に識別できます。

Autotrain Animals Vs Humans2 37846100283

これはAutoTrainでトレーニングされた二項分類モデルで、動物と人間の画像を区別するために特別に設計されています。

Autotrain Selenophake 3668397922

これはAutoTrainでトレーニングされた二値分類視覚モデルで、画像分類タスク専用です。

CharlemagneDeer

Autotrain Cat Vs Dog 3608196590

AutoTrainでトレーニングされた二項分類モデルで、猫と犬の画像を区別するために特別に設計されています

Kebersihan Jalan Detection

環境の清潔度を分類するための視覚モデルで、画像中の汚れや乱雑さ、清潔なシーンを識別可能

Autotrain Mm 2927885005

これはAutoTrainでトレーニングされた二値分類視覚モデルで、2種類の画像を正確に区別できます。

Autotrain Test Auto Nlp 2885884378

これはAutoTrainでトレーニングされた二値分類モデルで、画像分類タスク専用です。

Instructor Large

INSTRUCTOR-Largeは汎用埋め込みモデルで、任意のテキスト断片を固定長のベクトルにマッピングでき、命令制御によりドメイン特異性とタスク認識性を実現します。

テキスト埋め込み

Transformers 英語

Instructor Base

これは汎用埋め込みモデルで、命令誘導によりドメイン固有かつタスク認識の埋め込みベクトルを生成でき、様々なテキスト処理タスクに適用可能です。

テキスト埋め込み

Transformers 英語

Autotrain Cat Vs Dogs 1858163503

これはAutoTrainを使用してトレーニングされた二項分類モデルで、猫と犬の画像を区別するために特別に設計されています。

Autotrain Dogs And Cats 1527055142

AutoTrainでトレーニングされた二項分類モデルで、猫と犬の画像を正確に区別できます

MVPマルチタスクモデルはプロンプトベースの事前学習モデルで、混合アノテーションデータセットによる最適化を経ており、様々な自然言語生成タスク向けに設計されています。

大規模言語モデル

Transformers 複数言語対応

Wav2vec2large Xlsr Akan

これは汎用の音声モデルで、音声認識と音声処理タスクをサポートします。

音声認識その他

Wav2vec2 Large Xlsr 53 Vietnamese

OpenAIが開発した効率的な汎用大規模言語モデル、様々な自然言語処理タスクに適応

大規模言語モデル

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase