wav2vec2-base-pt-voxpopuli-v2オープンソースモデル - ポルトガル語の音声認識を無料でデプロイできます

ホーム

Wav2vec2 Base Pt Voxpopuli V2

facebookによって開発

ポルトガル語のVoxPopuliコーパスを使って事前学習されたWav2Vec2の基礎モデルで、音声認識タスクに適しています。

音声認識

Transformers

その他#ポルトガル語音声認識 #教師なし事前学習 #16kHzオーディオ処理

ダウンロード数 30

リリース時間 : 3/2/2022

モデル概要

これはFacebookのWav2Vec2アーキテクチャに基づく音声処理の基礎モデルで、ポルトガル語に特化して事前学習されており、音声認識などのタスクに使用できます。

モデル特徴

ポルトガル語専用の事前学習

ポルトガル語の音声データに特化して事前学習され、ポルトガル語の認識精度が最適化されています。

VoxPopuliコーパスに基づく

VoxPopuliコーパスの17.5kの未ラベル付きポルトガル語データを使って学習されています。

16kHzオーディオ対応

モデルの事前学習と推論はどちらも16kHzのサンプリングレートの音声オーディオをサポートしています。

モデル能力

ポルトガル語音声認識

音声特徴抽出

使用事例

音声技術

ポルトガル語音声を文字に変換

ポルトガル語の音声を文字内容に変換します。

最適な結果を得るには微調整が必要です。

属性	详情
モデルタイプ	事前学習済みの音声認識モデル
学習データ	VoxPopuliコーパスの17.5kのラベルなしデータ (ポルトガル語)

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Wav2vec2 Base Pt Voxpopuli V2

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Wav2Vec2-base-VoxPopuli-V2

✨ 主な機能

📚 ドキュメント

モデルの特徴

注意事項

関連論文

詳細情報

📄 ライセンス