W

Wav2vec2 Base Timit Test3

Broketteによって開発
facebook/wav2vec2-baseをファインチューニングした音声認識モデル、具体的なトレーニングデータセットは明記されていません
ダウンロード数 22
リリース時間 : 4/7/2022

モデル概要

このモデルはwav2vec2アーキテクチャに基づく音声認識モデルで、音声からテキストへの変換タスクに適しています。

モデル特徴

wav2vec2アーキテクチャベース
Facebookがオープンソースで公開しているwav2vec2-baseモデルを基本アーキテクチャとして採用
ファインチューニング版
基本モデルに対してファインチューニングを実施、ただし具体的なデータセットは明記されていません
音声認識能力
音声オーディオをテキストに変換することが可能

モデル能力

音声認識
音声からテキストへの変換

使用事例

音声文字起こし
会議議事録
会議の録音を自動的に文字記録に変換
音声メモ
音声メモを検索可能なテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase