世界のAIモデルにアクセス - 次世代アプリ開発を加速

汎用から専門まで - 全AIモデルを一つのプラットフォームで

人気

最新

いいね数高

フィルター

商用モデル

オープンソースモデル

分類

フレームワーク

オープンソースライセンス

言語

選択条件:

リセット

2671個のモデルが条件に一致します

人気

最新

いいね数高

Indonesian Roberta Base Posp Tagger

これはインドネシア語RoBERTaモデルをファインチューニングした品詞タグ付けモデルで、indonluデータセットで訓練され、インドネシア語テキストの品詞タグ付けタスクに使用されます。

シーケンスラベリング

Transformers その他

Gender Classification

PyTorchとHuggingPicsを使用して構築された画像分類モデルで、画像内の性別を識別します

Wav2vec2 Base Finetuned Speech Commands V0.02

このモデルはfacebook/wav2vec2-baseをspeech_commandsデータセットでファインチューニングした音声コマンド認識モデルで、精度は97.59%です。

Filipino Wav2vec2 L Xls R 300m Official

facebook/wav2vec2-xls-r-300mをフィリピン語音声データセットでファインチューニングした音声認識モデル

Gender Classification 2

これはPyTorchフレームワークとHuggingPicsツールで生成された画像分類モデルで、性別分類タスク専用です。

Bert Base Arabertv02

AraBERTはBERTアーキテクチャに基づくアラビア語の事前学習言語モデルで、アラビア語理解タスクに特化して最適化されています。

大規模言語モデルアラビア語

BLOOMZシリーズの中型多言語モデルで、さまざまな自然言語処理タスクに適しています。

大規模言語モデル

Transformers 複数言語対応

Whisper Medium Fleurs Lang Id

OpenAI Whisper-mediumをファインチューニングした音声言語識別モデルで、FLEURSデータセットで88.05%の精度を達成

Distil Large V3

Distil-WhisperはWhisper large-v3の知識蒸留バージョンで、英語自動音声認識に特化し、より高速な推論速度を提供しながら、オリジナルモデルに近い精度を維持します。

音声認識英語

Distilroberta Finetuned Financial News Sentiment Analysis

DistilRoBERTaを微調整した金融ニュース感情分析モデルで、正解率は98.23%に達します。

テキスト分類

Wikineural Multilingual Ner

ニューラルネットワークと知識ベースを融合した多言語固有表現認識モデルで、9種類の言語をサポートします。

シーケンスラベリング

Transformers 複数言語対応

Whisper Small Ft Common Language Id

openai/whisper-smallをファインチューニングした汎用言語識別モデルで、評価データセットでの精度は88.6%

Distil Medium.en

Distil-WhisperはWhisperモデルの蒸留バージョンで、オリジナルより6倍速く、サイズが49%縮小され、英語音声認識タスクでオリジナルに近い性能を維持しています。

音声認識英語

人間の肌タイプを分類するための画像分類モデルで、公平性を実現し、すべての肌色で正確に動作することを目指しています。

Ibert Roberta Base Abusive Or Threatening Speech

このモデルはibert-roberta-baseをファインチューニングしたバージョンで、誹謗中傷や脅迫的発言の検出に特化しています。

テキスト分類

Wavlm Libri Clean 100h Base Plus

microsoft/wavlm-base-plusを基にLIBRISPEECH_ASR - CLEANデータセットでファインチューニングした自動音声認識モデル

patrickvonplaten

Classify News Category Iptc

これは多言語ニュース分類モデルで、IPTCニュースコードに基づいてノルウェー語、スウェーデン語、英語のニュース内容を分類でき、16の事前定義されたカテゴリをサポートします。

テキスト分類

ilsilfverskiold

Bpmn Information Extraction V2

bert-base-casedをファインチューニングしたBPMNプロセス情報抽出モデルで、テキスト化されたプロセス記述から実行者、タスクなどの主要要素を抽出

シーケンスラベリング

Nb Wav2vec2 1b Nynorsk

Facebook/MetaのXLS-R特徴抽出器をファインチューニングしたニーノシュク自動音声認識モデルで、NPSCテストセットでWERが11.32%を達成。

Transformers その他

CLIP Convnext Large D 320.laion2B S29b B131k Ft Soup

ConvNeXt-Largeアーキテクチャに基づくCLIPモデルで、LAION-2Bデータセットで訓練され、ゼロショット画像分類と画像テキスト検索タスクをサポート

テキスト生成画像

CLIP Convnext Large D.laion2b S26b B102k Augreg

LAION-2Bデータセットでトレーニングされた大規模ConvNeXt-Large CLIPモデル、ゼロショット画像分類と画像テキスト検索タスクをサポート

テキスト生成画像

CLIP ViT L 14 Laion2b S32b B82k

OpenCLIPフレームワークを使用し、LAION-2B英語サブセットでトレーニングされた視覚言語モデル。ゼロショット画像分類と画像テキスト検索をサポート

テキスト生成画像

Nb Wav2vec2 300m Nynorsk

VoxRex特徴抽出器をベースに微調整された3億パラメータの音声認識モデルで、ニューノルウェー語（Nynorsk）に最適化されており、NPSCテストセットでのWERは12.22%です。

Transformers その他

Yolov8m Table Extraction

YOLOv8mベースの物体検出モデルで、表抽出タスク専用に設計されており、境界線あり・なしの表を検出可能です。

Yolov5n License Plate

YOLOv5nベースの軽量ナンバープレート検出モデル、ナンバープレート認識タスクに最適化

Table Detection And Extraction

YOLOv8sベースのテーブル検出モデルで、画像内のボーダー付き・ボーダーレステーブルを正確に識別可能

TensorBoard 英語

DistilBERTをファインチューニングした軽量な固有表現認識モデル、性能と効率のバランス

シーケンスラベリング

Transformers 英語

Distil Large V2

Distil-WhisperはWhisperモデルの蒸留版で、速度が6倍向上し、サイズが49%縮小され、非分布評価セットでの性能はWERでわずか1%の差しかありません。

音声認識英語

CLIP Convnext Base W Laion2b S13b B82k Augreg

ConvNeXt-Baseアーキテクチャを基にしたCLIPモデルで、OpenCLIPを使用してLAION-5Bのサブセットでトレーニングされ、ゼロショット画像分類タスクに焦点を当てています

テキスト生成画像

Wav2vec2 Lg Xlsr En Speech Emotion Recognition

Wav2Vec 2.0をファインチューニングした音声感情認識モデルで、8種類の英語感情を識別可能、RAVDESSデータセットで82.23%の精度を達成

Gender Classification

distilbert-base-uncasedをファインチューニングした性別分類モデルで、評価セットで1.0の精度を達成

テキスト分類

Distil Small.en

Distil-WhisperはWhisperモデルの蒸留バージョンで、速度が6倍速く、サイズが49%縮小され、非分布評価セットで1% WERに近い性能を発揮します。

Transformers 英語

English Filipino Wav2vec2 L Xls R Test 09

jonatasgrosman/wav2vec2-large-xlsr-53-englishをベースにファインチューニングした英語-フィリピン語音声認識モデル、評価セットでのWERは0.5750

Yolov8s Signature Detector

YOLOv8sをファインチューニングした手書き署名検出モデルで、ドキュメント画像内の署名位置特定に特化

Nb Whisper Tiny Verbatim

ノルウェー国立図書館がOpenAI Whisperを基に開発したノルウェー語自動音声認識モデル。逐語転写シナリオに特化して最適化され、全小文字無句読点テキストを出力

音声認識複数言語対応

Nb Wav2vec2 1b Bokmaal

Facebook/MetaのXLS - R特徴抽出器をベースに微調整されたノルウェー語自動音声認識モデルで、NPSCテストセットでの単語誤り率は6.33%

Transformers その他

BioMistralはMistralアーキテクチャを基に、医学分野向けに最適化されたオープンソース大規模言語モデルで、PubMed Centralのオープンアクセステキストデータを用いて追加事前学習を行い、多言語医学質問応答タスクをサポートします。

大規模言語モデル

Transformers 複数言語対応

AraGPT2はTransformerアーキテクチャに基づくアラビア語生成の事前学習モデルで、AUB MIND研究所によって開発され、さまざまなサイズのモデルバリアントをサポートしています。

大規模言語モデルアラビア語

CNERモデルはDeBERTa-v3-baseアーキテクチャに基づく固有表現認識モデルで、きめ細かいラベル付きの概念と固有表現を統合的に識別・分類できます。

シーケンスラベリング

Transformers 英語

Fullstop Punctuation Multilingual Base

FullStopはTransformerベースの多言語句読点予測モデルで、英語、ドイツ語、フランス語、イタリア語、オランダ語など複数の言語をサポートしています。

シーケンスラベリング

Transformers 複数言語対応

Spelling Correction English Base

これは実験的モデルで、英語テキストのスペルミスや句読点を修正することを目的としています。

テキスト生成

Transformers 英語

Vit Base Patch16 224 In21k Finetuned Cifar10

Google Vision Transformer (ViT)アーキテクチャに基づく事前学習モデルで、CIFAR-10データセットでファインチューニングされ、画像分類タスクに使用されます。

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase