S

Sew Small 100k Timit

patrickvonplatenによって開発
asapp/sew-small-100kをベースにTIMIT_ASR - NAデータセットでファインチューニングした自動音声認識モデル
ダウンロード数 16
リリース時間 : 3/2/2022

モデル概要

このモデルは自動音声認識(ASR)モデルで、TIMIT_ASRデータセットに特化して最適化されており、英語音声をテキストに変換できます。

モデル特徴

高効率音声認識
SEW小型アーキテクチャを採用し、性能を維持しながら効率を向上
TIMITデータセット最適化
TIMIT_ASRデータセットに特化してファインチューニングし、このデータセットでの認識精度を向上
低単語誤り率
評価セットで0.2988の単語誤り率を達成

モデル能力

英語音声認識
音声からテキストへの変換

使用事例

音声認識
音声文字起こし
英語音声コンテンツをテキストに変換
単語誤り率0.2988
音声コマンド認識
音声コマンドを認識・理解
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase