W

Wav2vec2 Base Finetuned Amd

justin1983によって開発
このモデルはfacebook/wav2vec2-baseを未知のデータセットでファインチューニングしたバージョンで、主に音声認識タスクに使用され、評価セットで84.55%の精度を達成しています。
ダウンロード数 14
リリース時間 : 5/5/2023

モデル概要

wav2vec2-baseアーキテクチャを基にファインチューニングした音声認識モデルで、自動音声テキスト変換タスクに適しています。

モデル特徴

高精度
評価セットで84.55%の精度を達成し、優れた性能を発揮します。
wav2vec2アーキテクチャ採用
実績のあるwav2vec2-baseアーキテクチャを採用し、優れた音声特徴抽出能力を備えています。
ファインチューニング最適化
ベースモデルに対して特定のドメインやアクセントに最適化されたファインチューニングを施しています。

モデル能力

音声認識
音声からテキストへの変換
自動音声転写

使用事例

音声テキスト化
会議議事録
会議の録音を自動的にテキスト記録に変換
精度84.55%
音声アシスタント
音声アシスタントのバックエンド認識エンジンとして利用
アクセシビリティアプリケーション
リアルタイム字幕生成
聴覚障害者向けにリアルタイム字幕サービスを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase