A

Asr Wav2vec2 Commonvoice 14 Zh CN

speechbrainによって開発
これはCommonVoice中国語データセットでトレーニングされたエンドツーエンドの自動音声認識システムで、wav2vec2.0とCTCアーキテクチャを使用し、中国語音声認識をサポートします。
ダウンロード数 36
リリース時間 : 8/9/2023

モデル概要

このモデルは中国語音声に特化した自動音声認識システムで、中国語音声をテキストに変換できます。事前トレーニングされたwav2vec2.0モデルとCTCデコーダを組み合わせ、CommonVoice中国語データセットでファインチューニングされています。

モデル特徴

エンドツーエンド音声認識
追加の言語モデルを必要とせず、音声からテキストへの完全な変換プロセスを提供します
wav2vec2.0事前トレーニングベース
facebook/wav2vec2-large-xlsr-53をベースモデルとして使用し、強力な音響特徴抽出能力を持っています
中国語最適化
中国語音声の特徴に特化して最適化され、CommonVoice中国語データセットでファインチューニングされています
軽量推論
CPUとGPU推論をサポートし、さまざまな展開シナリオに適しています

モデル能力

中国語音声認識
音声文字起こし
音声からテキストへの変換

使用事例

音声文字起こし
会議議録の自動文字起こし
中国語の会議録音を自動的に文字記録に変換します
音声メモ変換
ユーザーの中国語音声メモを編集可能なテキストに変換します
支援技術
音声入力システム
アプリケーションに中国語音声入力機能を追加します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase