モデル選定

Common Voice最適化

# Common Voice最適化

Distil Whisper Large V3 Ptbr

これはdistil-whisper-large-v3の微調整バージョンで、ブラジルポルトガル語の自動音声認識（ASR）に特化しており、Common Voice 16データセットと私有データセットを組み合わせて訓練されています。

Whisper Medium Portuguese

openai/whisper-mediumをcommon_voice_11_0データセットで微調整したポルトガル語音声認識モデル、単語誤り率6.5987

Transformers その他

Wav2vec2 Large Xlsr 53 German With Lm

これはXLSR Wav2Vec2アーキテクチャに基づくドイツ語自動音声認識モデルで、言語モデルサポートを備えており、Common Voiceドイツ語データセットで優れた性能を発揮します。

Transformers ドイツ語

Wav2vec2 Large Xlsr 53 Spanish With Lm

これはWav2Vec2-Large-XLSR-53をベースにしたスペイン語音声認識モデルで、言語モデルサポートを追加することで認識精度が大幅に向上しています。

音声認識スペイン語

patrickvonplaten

Wav2vec2 Xls R 300m Hy

facebook/wav2vec2-xls-r-300mモデルをアルメニア語データセットでファインチューニングした自動音声認識(ASR)モデルで、アルメニア語音声からテキストへの変換タスクをサポートします。

Transformers その他

Wav2vec2 Base Turkish

このモデルはCommon Voiceトルコ語データセットでファインチューニングされたWav2Vec2音声認識モデルで、トルコ語自動音声認識タスクで優れた性能を発揮します。

Transformers その他

Wav2vec2 Xls R 300m Cv8 Turkish

facebook/wav2vec2-xls-r-300mをファインチューニングしたトルコ語自動音声認識モデル、Common Voice 8.0 TRデータセットでトレーニング

Transformers その他

Wav2vec2 Large Fr Voxpopuli French

facebook/wav2vec2-large-fr-voxpopuliをファインチューニングしたフランス語音声認識モデル、Common Voice 6.1フランス語データセットでトレーニング、16kHz音声入力に対応

音声認識フランス語

Xls R Spanish Test

これはfacebook/wav2vec2-large-xlsr-53モデルをスペイン語Common Voice 7データセットで微調整した自動音声認識(ASR)モデルです。

Transformers スペイン語

W2v Hf Commonvoice From Xlsr53 Pretrain 0329UTC1500

facebook/wav2vec2-large-xlsr-53をCommon Voice日本語データセットでファインチューニングした音声認識モデル

スペイン語Common Voiceデータセットでファインチューニングされた音声認識モデル。facebook/wav2vec2-xls-r-300mアーキテクチャ採用。テストセットでWER14.6%を達成

Transformers スペイン語

Wav2vec2 Large Xlsr 53 Punjabi

これはHarveenchadha/vakyansh-wav2vec2-punjabi-pam-10をベースにCommon Voiceデータセットでファインチューニングしたパンジャーブ語自動音声認識モデルです

Transformers その他

Central Kurdish Xlsr

これはfacebook/wav2vec2 - xls - r - 300mモデルをベースに、クルド語中部方言で微調整された自動音声認識モデルで、Common Voice 8.0データセットで訓練されています。

Transformers その他

Hindi Base Wav2vec2

これはwav2vec2アーキテクチャに基づくヒンディー語の自動音声認識(ASR)モデルで、Common Voiceなどのデータセットで訓練されています。

Transformers その他

Wav2vec2 Xls R Sl A2

これはfacebook/wav2vec2-xls-r-300mモデルを基に、スロベニア語(MOZILLA - FOUNDATION/COMMON_VOICE_8_0 - SL)データセットで微調整した自動音声認識モデルです。

Transformers その他

Wav2vec2 Large Xlsr 53 French Punctuation

wav2vec2-large-xlsr-53アーキテクチャに基づくフランス語自動音声認識モデルで、句読点予測をサポート

音声認識フランス語

Xlsr Kurmanji Kurdish

このモデルは、facebook/wav2vec2 - xls - r - 300mをベースに、クルマンジ・クルド語データセットで微調整された自動音声認識モデルです。

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase