モデル選定

Whisperファインチューニング

# Whisperファインチューニング

KinyaWhisperはOpenAI Whisperモデルをファインチューニングしたルワンダ語自動音声認識(ASR)システムで、低リソースの先住民言語向けに設計されています。

Transformers その他

Whisper Small Ta

このモデルは、OpenAIのWhisper Smallをタミル語のCommon Voice 17.0データセットでファインチューニングした音声認識モデルで、単語誤り率(WER)は43.23%です。

Transformers その他

Indian Accent English Whisper Finetuned Epoch 15

OpenAI Whisper-large-v3-turboをファインチューニングしたインド英語アクセント音声認識モデルで、インド英語アクセントデータセットで7.99%の単語誤り率を達成

Transformers 英語

Quran Whisper Base Fine Tune

このモデルは、openai/whisper-baseをquran-ayat-speech-to-textデータセットでファインチューニングしたアラビア語音声認識モデルで、コーラン経文の音声から文字への変換タスクに特化しています。

Transformers アラビア語

Whisper Base Pl

OpenAI Whisper-baseモデルをポーランド語Common Voice 17.0データセットでファインチューニングした音声認識モデル

Transformers その他

Vlzcrz Whisper Small Japanese 2

openai/whisper-smallをCommon Voice 17.0データセットでファインチューニングした日本語音声認識モデル

Transformers 日本語

Viwhisper Medium

ベトナム語音声認識タスク向けに最適化されたWhisper-mediumモデル、1308時間のベトナム語データでファインチューニング済み

Transformers その他

Akan Whisper Model

OpenAI Whisperモデルをファインチューニングしたバージョンで、ガーナの低リソース言語であるアカン語の自動音声認識タスク向けに設計されています

Transformers その他

Whisper Small Khmer

openai/whisper-smallをファインチューニングした音声認識モデルで、クメール語の文字起こし精度を特別に最適化

Transformers その他

Whisper Tiny Myanmar

このモデルはopenai/whisper-tinyをビルマ語音声データセットでファインチューニングした自動音声認識(ASR)モデルで、ビルマ語音声からテキストへの変換タスクをサポートします。

Transformers その他

Akylai STT Small

キルギス語Whisper ASRは、キルギス語に特化した自動音声認識ソリューションで、事前学習済みWhisperモデルをファインチューニングしたものです。

Transformers その他

the-cramer-project

Detect Language

Whisper Mediumモデルをファインチューニングした言語識別モデルで、FLEURSデータセット上の言語分類タスク専用

apparaomulpuriril

Whisper Sinhala Audio To Text

openai/whisper-smallをファインチューニングしたシンハラ語音声認識モデルで、シンハラ語音声をテキストに変換できます。

Whisper Small Kyrgyz

Whisperアーキテクチャに基づくキルギス語自動音声認識(ASR)モデルで、キルギス共和国大統領府国家言語・言語政策全国委員会の支援により開発

Transformers その他

Whisper Tiny Vi

OpenAI Whisper-tinyアーキテクチャをベースにファインチューニングしたベトナム語自動音声認識(ASR)モデルで、複数のベトナム語データセットで優れた性能を発揮

Transformers その他

Phowhisper Small

PhoWhisperはベトナム語自動音声認識のために特別に設計されたシステムで、Whisperモデルをファインチューニングしており、さまざまなベトナム語のアクセントをサポートしています。

Transformers その他

Whisper Large V3 Japanese 4k Steps

openai/whisper-large-v3をベースにCommon Voice 16.1日本語データセットでファインチューニングした音声認識モデル、4000ステップ訓練

Transformers 日本語

Haitian Speech To Text

ハイチクレオール語に最適化されたWhisper音声認識モデルで、高精度な音声テキスト変換能力を備えています

Transformers その他

Audiosangraha Audio To Text

openai/whisper-smallをファインチューニングした音声からテキストへの変換モデルで、音声翻訳とテキスト生成タスクをサポートします。

Whisper Large V3 Atco2 Asr

OpenAI Whisper-large-v3をファインチューニングした音声認識モデルで、航空交通管制(ATCO)シナリオに特化しており、単語誤り率17.04%

Whisper Large V2 Spanish

OpenAI Whisper-large-v2モデルをCommon Voice 13.0スペイン語データセットでファインチューニングした音声認識モデル

Asr Whisper Medium Commonvoice Fa

CommonVoice-14.0ペルシャ語データセットでファインチューニングされたwhisper mediumモデルで、ペルシャ語自動音声認識タスク用です。

音声認識その他

Whisper Base Japanese

このモデルは、Common Voice、JVS、JSUTデータセットを使用してopenai/whisper-baseを日本語向けにファインチューニングしたもので、日本語音声認識タスクに適しています。

Transformers 日本語

Afrispeech Large A100

Whisper-large-v2をファインチューニングしたアフリカ言語音声認識モデル。afrispeech-200データセットで訓練され、単語誤り率(WER)は14.81

Whisper Small Ft Common Language Id

openai/whisper-smallをファインチューニングした汎用言語識別モデルで、評価データセットでの精度は88.6%

Whisper Medium Fleurs Lang Id

OpenAI Whisper-mediumをファインチューニングした音声言語識別モデルで、FLEURSデータセットで88.05%の精度を達成

Whisper Large V2 Kazakh

このモデルはOpenAIのWhisper Large V2をカザフ語Common Voice 11.0データセットでファインチューニングした音声認識モデルです

Transformers その他

Whisper Large V2 Cv11 German

openai/whisper-large-v2をCommon Voice 11.0ドイツ語データセットでファインチューニングした自動音声認識モデルで、ドイツ語音声をテキストに変換可能、単語誤り率5.76

Transformers ドイツ語

Whisper Medium Ar

openai/whisper-mediumをアラビア語データセットでファインチューニングした音声認識モデル

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase