wav2vec2 - スペイン語オープンソース音声認識モデル - 無料でスペイン語の音声を高精度に認識可能

ホーム

Wav2vec2 Spanish

flax-communityによって開発

Common Voiceのスペイン語データで事前学習された音声認識モデル、Flaxフレームワークを使用しTPUでトレーニング

音声認識スペイン語#スペイン語音声認識 #自己教師あり学習 #Flaxフレームワークでのトレーニング

ダウンロード数 16

リリース時間 : 3/2/2022

モデル概要

これはWav2Vec2アーキテクチャに基づくスペイン語自動音声認識(ASR)モデルで、スペイン語音声をテキストに変換できます。

モデル特徴

自己教師あり学習

Wav2Vec2の自己教師あり学習フレームワークを採用し、生の音声から音声表現を学習

多言語サポート

スペイン語音声認識に特化していますが、アーキテクチャは他の言語への拡張をサポート

効率的なトレーニング

FlaxフレームワークとGoogle TPUを使用した効率的なトレーニング

モデル能力

スペイン語音声認識

生音声処理

音声からテキストへの変換

使用事例

音声技術

音声文字起こし

スペイン語音声コンテンツをテキスト形式に変換

音声アシスタント

スペイン語音声アシスタントに音声認識機能を提供

属性	詳情
モデルタイプ	Wav2Vec2
学習データ	Common Voiceのスペイン語部分

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Wav2vec2 Spanish

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Wav2Vec2 スペイン語版

🚀 クイックスタート

✨ 主な機能

📚 ドキュメント

モデルの説明

学習データ

チームメンバー