Wav2vec2 Large Xlsr 53 Portuguese
Facebookが開発したWav2Vec 2.0アーキテクチャに基づく大規模ポルトガル語自動音声認識(ASR)モデルで、ポルトガル語音声からテキストへの変換タスクをサポートします。
Downloads 425
Release Time : 3/2/2022
Model Overview
このモデルはWav2Vec 2.0アーキテクチャでトレーニングされた大規模なクロスランゲージ音声表現モデル(XLSR)で、特にポルトガル語向けに最適化されており、ポルトガル語音声を正確にテキストに変換できます。
Model Features
クロスランゲージ音声表現
XLSR-53アーキテクチャに基づき、言語を超えた共通の音声特徴表現を学習可能
ポルトガル語最適化
特にポルトガル語の音声特性に合わせて最適化されたトレーニングを実施
エンドツーエンド認識
中間特徴抽出ステップなしで、生の音声入力から直接テキスト出力を生成
Model Capabilities
ポルトガル語音声認識
音声からテキストへの変換
自動音声書き起こし
Use Cases
音声書き起こし
ポルトガル語音声から文字へ
ポルトガル語の音声内容を自動的に編集可能なテキスト形式に変換
Common Voiceポルトガル語テストセットでWER27.1%を達成
音声アシスタント
ポルトガル語音声コマンド認識
ポルトガル語音声アシスタントや音声制御アプリケーションの構築に使用
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98