A

Assignment1 Jane

Classroom-workshopによって開発
s2t-small-librispeech-asr は、自動音声認識(ASR)のための音声からテキストへの変換器(S2T)モデルで、シーケンス・ツー・シーケンス変換器アーキテクチャに基づいています。
ダウンロード数 29
リリース時間 : 6/2/2022

モデル概要

このモデルは、エンドツーエンドのシーケンス・ツー・シーケンス変換器モデルで、標準的な自己回帰交差エントロピー損失を使用して訓練され、自己回帰的に書き起こしテキストを生成します。

モデル特徴

エンドツーエンド音声認識
音声入力から直接テキスト出力を生成し、中間処理ステップを必要としません。
自己回帰生成
自己回帰方式で書き起こしテキストを生成し、一貫性と正確性を確保します。
LibriSpeechに基づく訓練
LibriSpeechデータセットで訓練されており、英語音声認識タスクに適しています。

モデル能力

音声認識
英語書き起こし

使用事例

音声からテキストへ
会議議事録
会議の録音を自動的にテキスト記録に変換します。
音声メモ
音声メモを編集可能なテキスト形式に変換します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase