W

Wav2vec2 Base 10k Voxpopuli Ft Cs

facebookによって開発
Facebook Wav2Vec2アーキテクチャに基づく音声認識モデルで、VoxPopuliコーパスの10Kラベルなしチェコ語データで事前学習され、チェコ語転写データでファインチューニングされています。
ダウンロード数 226
リリース時間 : 3/2/2022

モデル概要

このモデルはチェコ語音声認識タスクに最適化された自動音声認識(ASR)モデルで、チェコ語音声をテキストに変換するのに適しています。

モデル特徴

チェコ語最適化
チェコ語音声認識タスクに特化して最適化され、チェコ語データでファインチューニングされています
VoxPopuliコーパスベース
VoxPopuli大規模多言語コーパスの10Kラベルなしチェコ語データを使用して事前学習されています
Wav2Vec2アーキテクチャ
Facebookの先進的なWav2Vec2アーキテクチャを採用し、生の音声から直接音声表現を学習します

モデル能力

チェコ語音声認識
音声からテキストへの変換
自動音声転写

使用事例

音声書き起こし
チェコ語音声転写
チェコ語音声コンテンツを自動的にテキストに変換します
音声アシスタント
チェコ語音声コマンド認識
チェコ語音声アシスタントシステムでのコマンド認識に使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase