モデル選定

音声認識の微調整

# 音声認識の微調整

Audio Classification Model

facebook/wav2vec2-base-960hを微調整した音声分類モデルで、具体的な用途とトレーニングデータは明記されていません。

facebook/wav2vec2-baseを微調整した音声処理モデル、精度は28.57%

Wav2vec2 Nsc Final 2 Google Colab

facebook/wav2vec2-baseを微調整した音声処理モデル、具体的な用途は明記されていません

Wav2vec2 Base Librispeech Demo Colab

このモデルはfacebook/wav2vec2-baseをLibriSpeechデータセットで微調整した音声認識モデルで、英語音声からテキストへの変換タスクに適しています。

このモデルはfacebook/wav2vec2-baseを微調整した音声処理モデルで、具体的な用途は明記されていません

Wav2vec2 Base Toy Train Data Random Low Pass

このモデルはfacebook/wav2vec2-baseを未知のデータセットで微調整した音声認識モデルで、自動音声認識(ASR)タスクに主に使用されます。

Wav2vec2 Large Xlsr 53 Toy Train Data Masked Audio 10ms

facebook/wav2vec2-large-xlsr-53を基に微調整した音声認識モデルで、10ms音声マスキング訓練データで最適化されています

Wav2vec2 Base Toy Train Data Masked Audio 10ms

facebook/wav2vec2-baseを微調整した音声認識モデルで、10ms音声マスキングタスクでトレーニング

Wav2vec2 Base Toy Train Data Augment 0.1

facebook/wav2vec2-baseを微調整した音声認識モデルで、玩具データセットで訓練され、0.1の比率でデータ拡張が適用されています

Wav2vec2 Base Toy Train Data Augment 0.1.csv

このモデルはfacebook/wav2vec2-baseをベースに微調整された音声認識モデルで、データ拡張技術（拡張率0.1）を使用しています。

Wav2vec2 Model1 Torgo

facebook/wav2vec2-baseをベースに微調整した音声認識モデル

Wav2vec2 Large Xlsr 53 Toy Train Data Augment 0.1.csv

このモデルはfacebook/wav2vec2-baseを微調整した音声認識モデルで、データ拡張技術を使用して訓練されています

Sew D Small 100k Ft Timit

asapp/sew-d-small-100kを基にTIMIT_ASRデータセットで微調整された自動音声認識モデル

patrickvonplaten

Sew D Small 100k Timit

このモデルはasapp/sew-d-small-100kをベースにTIMIT_ASR - NAデータセットで微調整された自動音声認識モデルで、評価セットで0.8061の単語誤り率を達成しました。

patrickvonplaten

facebook/wav2vec2-baseを微調整した音声認識モデル、単語誤り率(WER)は1.0

microsoft/unispeech-sat-baseをTIMIT_ASRデータセットで微調整した自動音声認識モデル

patrickvonplaten

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase