Wav2vec2 Base 10k 8khz Pt Cv7 2
W
Wav2vec2 Base 10k 8khz Pt Cv7 2
lgrisによって開発
このモデルはwav2vec2アーキテクチャに基づくポルトガル語自動音声認識モデルで、Common Voice 7データセットで微調整されており、8kHzサンプリングレートのオーディオ入力をサポートします。
ダウンロード数 24
リリース時間 : 3/2/2022
モデル概要
wav2vec2アーキテクチャに基づくポルトガル語音声認識モデルで、8kHzサンプリングレートのオーディオに最適化され、Common Voice 7データセットで微調整されており、ポルトガル語音声からテキストへの変換タスクに適しています。
モデル特徴
ポルトガル語最適化
ポルトガル語音声認識タスクに特化して最適化および微調整されています
8kHzサンプリングレートサポート
8kHzサンプリングレートのオーディオ入力をサポートし、電話品質の音声認識に適しています
Common Voice 7微調整
Mozilla Common Voice 7ポルトガル語データセットで微調整されています
モデル能力
ポルトガル語音声認識
8kHzオーディオ処理
自動音声からテキストへの変換
使用事例
音声書き起こし
ポルトガル語音声転写
ポルトガル語の音声内容をテキストに変換
Common Voice 7テストセットでWERが36.9
音声アシスタント
ポルトガル語音声コマンド認識
ポルトガル語の音声コマンドを認識し理解
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98