W

Wav2vec2 Large Xlsr 53 Sakha

anton-lによって開発
XLSR-53大規模モデルをファインチューニングしたヤクート語音声認識モデル、単語誤り率32.23%
ダウンロード数 25
リリース時間 : 3/2/2022

モデル概要

このモデルはFacebookのwav2vec2-large-xlsr-53モデルを基に、Common Voiceデータセットを使用してヤクート語向けにファインチューニングした自動音声認識(ASR)モデルです。

モデル特徴

低リソース言語サポート
ヤクート語のような低リソース言語に特化して最適化
言語モデル不要
追加の言語モデルサポートなしで直接使用可能
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力に最適化

モデル能力

ヤクート語音声認識
音声テキスト変換
自動音声転写

使用事例

音声転写
ヤクート語音声転写
ヤクート語音声コンテンツをテキストに変換
単語誤り率32.23%
音声アシスタント
ヤクート語音声コマンド認識
ヤクート語音声アシスタントの基本認識機能に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase