W

Wav2vec2 Large Xls R 300m Pt Colab

robertodtgによって開発
このモデルは、facebook/wav2vec2-xls-r-300mをcommon_voice_9_0データセットでファインチューニングした音声認識モデルで、ポルトガル語の音声からテキストへの変換タスクをサポートします。
ダウンロード数 107
リリース時間 : 6/24/2022

モデル概要

これはポルトガル語に最適化された音声認識モデルで、wav2vec2-xls-r-300mアーキテクチャを基にファインチューニングされ、Common Voice 9.0データセットでトレーニングされており、ポルトガル語の音声からテキストへの変換タスクに適しています。

モデル特徴

ポルトガル語最適化
ポルトガル語音声認識タスクに特化してファインチューニングされています
大規模事前学習モデルベース
facebook/wav2vec2-xls-r-300m事前学習モデルを基にしており、強力な音声特徴抽出能力を有します
比較的軽量
3億パラメータ規模で、性能を維持しながら比較的軽量です

モデル能力

ポルトガル語音声認識
音声からテキストへの変換
自動音声認識

使用事例

音声書き起こし
ポルトガル語音声書き起こし
ポルトガル語の音声内容をテキストに変換します
評価データセットで17.36%の単語誤り率を達成
音声アシスタント
ポルトガル語音声コマンド認識
ポルトガル語音声アシスタントや音声制御アプリケーションの構築に使用できます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase