W

Wav2vec2 Base Lj Demo Colab

mohamed-illiyasによって開発
facebook/wav2vec2-baseモデルを微調整した音声認識モデルで、英語音声からテキストへの変換タスクに適しています。
ダウンロード数 27
リリース時間 : 3/2/2022

モデル概要

このモデルはwav2vec2アーキテクチャに基づく音声認識モデルで、微調整後に英語音声からテキストへの変換タスクに使用できます。

モデル特徴

wav2vec2アーキテクチャベース
Facebook Researchが開発したwav2vec2基本アーキテクチャを採用し、優れた音声特徴抽出能力を備えています。
微調整バージョン
基本モデル上で微調整を行い、特定の音声データセットに対して最適化されている可能性があります。
軽量モデル
wav2vec2-baseバージョンに基づいており、大規模モデルと比べて展開と使用が容易です。

モデル能力

英語音声認識
音声からテキストへ
自動音声認識

使用事例

音声文字起こし
英語音声からテキストへ
英語音声コンテンツをテキスト形式に変換
単語誤り率(WER)が1.0
音声アシスタント
音声コマンド認識
英語音声コマンドを認識して処理
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase