モデル選定

CommonVoiceデータセット

# CommonVoiceデータセット

Hindi SpeechT5 Finetuned

このモデルは、microsoft/speecht5_ttsをcommon_voice_17_0データセットのヒンディー語検証セットで微調整した音声合成モデルです。

Transformers その他

Tacotron2 Cv Females

これはTacotron2アーキテクチャに基づくテキスト音声変換(TTS)システムで、ルガンダ語のCommonVoiceデータセットを使用してトレーニングされ、特に女性の音声に最適化されています。

音声合成その他

Wav2vec2 Turkish Gender Classification

facebook/wav2vec2-baseをファインチューニングしたトルコ語性別分類モデル、common_voice_17_0データセットでトレーニングされ、テストセットの精度は84.79%

Speech Accent Pt Br Classifier

音声ベースのアクセント分類器で、ポルトガル語（ブラジル）とその他のアクセントを区別します。

Transformers 複数言語対応

Asr Whisper Medium Commonvoice Fa

CommonVoice-14.0ペルシャ語データセットでファインチューニングされたwhisper mediumモデルで、ペルシャ語自動音声認識タスク用です。

音声認識その他

Wav2vec2 Base Common Voice 40p Persian Colab

このモデルはfacebook/wav2vec2-baseをペルシャ語データセットでファインチューニングした音声認識モデルで、主にペルシャ語音声からテキストへの変換タスクに使用されます。

Wav2vec2 Large Xlsr 53 Th Cv8 Newmm

このモデルはCommonVoice V8データセットでトレーニングされたタイ語自動音声認識モデルで、wav2vec2-large-xlsr-53アーキテクチャを採用し、newmmトークナイザーを使用し、言語モデルを統合することで、タイ語音声認識の精度を大幅に向上させています。

Transformers その他

Wav2vec2 Commonvoice Tamil

Harveenchadha/vakyansh-wav2vec2-tamil-tam-250をベースにcommon_voiceデータセットで微調整したタミル語音声認識モデル

Wav2vec2 Large Xls R 300m Tamil Colab

facebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングしたタミル語音声認識モデル

Wav2vec2 Xls R 300m Tr Med CommonVoice8 Tr Med CommonVoice8

XLS-Rアーキテクチャに基づくトルコ語音声認識モデル、Common Voice 8データセットでファインチューニング

このモデルは、facebook/wav2vec2 - xls - r - 300mをCommon Voiceデータセットでファインチューニングした中国語（普通話）音声認識モデルです。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase