モデル選定

ImageNet最適化

# ImageNet最適化

Hiera Base 224 In1k Hf

Hieraは階層型ビジョントランスフォーマーモデルで、高速かつ強力でシンプルな特徴を持ち、幅広い画像・動画タスクで既存技術を凌駕する性能を発揮しながら、処理速度も大幅に向上させています。

Transformers 英語

OpenAI CLIPで初期化された視覚言語モデルで、ImageNetで教師あり敵対的ファインチューニングを行い、ロバスト性強化特性を備えています

テキスト生成画像

OpenAI CLIPを初期化した視覚言語モデルで、教師なし敵対的微調整によりロバスト性を向上

テキスト生成画像

OpenAI CLIPで初期化された視覚言語モデルで、教師なし敵対的微調整によりロバスト性を向上

テキスト生成画像

Vit Hybrid Base Bit 384

ハイブリッドビジョントランスフォーマー（ViT）モデルは、畳み込みネットワークとTransformerアーキテクチャを組み合わせたもので、画像分類タスクにおいてImageNetで優れた性能を発揮します。

Convnext Small 224

ConvNeXTは純粋な畳み込みモデルで、視覚トランスフォーマーからインスピレーションを得て設計され、ImageNet-1kデータセットでトレーニングされ、従来の視覚トランスフォーマーよりも優れた性能を発揮します。

Convnext Base 224

ConvNeXTは純粋な畳み込みモデルで、ビジュアルTransformerからインスピレーションを得て設計され、ImageNet - 1kデータセットで訓練され、画像分類タスクに使用されます。

Convnext Large 224

ConvNeXTは純粋な畳み込みモデルで、視覚Transformerからインスピレーションを得た設計で、ImageNet-1kデータセットで224x224解像度でトレーニングされました。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase