モデル選定

LibriSpeechファインチューニング

# LibriSpeechファインチューニング

Wav2vec2 Base Librispeech Demo Colab

このモデルはfacebook/wav2vec2-baseをLibriSpeechデータセットでファインチューニングした音声認識モデルで、評価セットで0.3174の単語誤り率を達成しました。

Hubert Base Librispeech Demo Colab

facebook/hubert-large-ls960-ftをファインチューニングした音声認識モデルで、LibriSpeechデータセットでトレーニング済み

これはF5-TTSモデルのイタリア語ファインチューニング版で、facebook/multilingual_librispeechデータセットでトレーニングされ、イタリア語のテキスト読み上げタスクに特化しています。

音声合成その他

Speecht5 Finetuned Multilingual Librispeech De

Microsoft SpeechT5モデルをドイツ語LibriSpeechデータセットでファインチューニングしたテキストから音声へのモデル

Transformers ドイツ語

Librispeech 100h Supervised Meta

Kuray107/librispeech-5h-supervisedをファインチューニングした音声認識モデルで、100時間のLibriSpeechデータセットでトレーニング

Data2vec Audio Large 960h

Data2Vecは音声、視覚、言語タスクに適用可能な汎用自己教師あり学習フレームワークです。この音声大規模モデルはLibriSpeechの960時間音声データで事前学習とファインチューニングされ、自動音声認識タスク向けに最適化されています。

Transformers 英語

Unispeech Sat Base 100h Libri Ft

UniSpeech-SAT基本モデルを基に、LibriSpeech音声データで100時間のファインチューニングを行った自動音声認識モデル

Transformers 英語

Wavlm Base Libri Clean 100

WavLMアーキテクチャに基づく自動音声認識モデルで、LibriSpeech CLEANデータセット（100時間）でファインチューニング済み

anjulRajendraSharma

Wav2vec2 100m Mls German Ft

このモデルはfacebook/wav2vec2-xls-r-100mを多言語LibriSpeechドイツ語データセットでファインチューニングした自動音声認識モデルです

patrickvonplaten

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase