モデル選定

マルチデータセットトレーニング

# マルチデータセットトレーニング

Vitpose Base Coco Aic Mpii

ViTPoseはビジョントランスフォーマーをベースとした人体姿勢推定モデルで、シンプルなアーキテクチャ設計によりMS COCOなどのベンチマークで優れた性能を発揮します。

Transformers 英語

Aura-4BはAuraIndustries/Aura-4Bをベースにした量子化バージョンで、llama.cppを使用してimatrix量子化を行い、複数の量子化タイプをサポートし、テキスト生成タスクに適しています。

大規模言語モデル英語

Birefnet Matting

BiRefNetはバイラテラル参照に基づく高解像度二分画像分割モデルで、背景除去とマスク生成タスクに特化しています。

画像セグメンテーション

Birefnet Lite 2K

高解像度二値画像分割のためのバイラテラル参照フレームワーク、背景除去とマスク生成タスクに特化

画像セグメンテーション

Rad Dino Maira 2

RAD-DINO-MAIRA-2は、DINOv2自己教師あり学習でトレーニングされたビジョントランスフォーマーモデルで、胸部X線画像のエンコードに特化しています。

Japanese Reranker Cross Encoder Large V1

日本語テキストソートタスクに最適化されたクロスエンコーダーモデルで、24層と1024隠れ層サイズの高性能アーキテクチャを備えています

テキスト埋め込み日本語

Japanese Reranker Cross Encoder Small V1

これは日本語でトレーニングされたリランカー（クロスエンコーダー）モデルで、テキストランキングタスクに使用されます。

テキスト埋め込み日本語

Japanese Reranker Cross Encoder Xsmall V1

これは日本語でトレーニングされたリランカー（クロスエンコーダー）モデルで、テキストランキングタスクに使用されます。

テキスト埋め込み日本語

PairRMは、大規模言語モデルの出力候補を比較・ランク付けするための効率的なペア報酬モデルで、RLHFやベストNサンプリングなど多様なアプリケーションシナリオをサポートします。

大規模言語モデル

Transformers 英語

BENT PubMedBERT NER Gene

これはPubMedBERTをファインチューニングした固有表現認識モデルで、バイオメディカルテキスト中の遺伝子とタンパク質エンティティを識別するために特別に設計されています。

シーケンスラベリング

Transformers 英語

T5 Xxl True Nli Mixture

これはT5-XXLアーキテクチャを基にした自然言語推論（NLI）モデルで、テキストペア間の含意関係（'1'は含意、'0'は非含意）を予測します。

大規模言語モデル

Transformers 英語

Wav2vec2 Large Xlsr Open Brazilian Portuguese V2

これはブラジルポルトガル語に最適化されたWav2vec2モデルで、複数のオープンデータセットでトレーニングされ、自動音声認識タスクに使用されます。

Transformers その他

Wav2vec2 Large Xlsr 53 Japanese

facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングした日本語音声認識モデルで、16kHzサンプリングレートの音声入力をサポート

音声認識日本語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase