M

Mandarin

GleamEyeBeastによって開発
これはwav2vec2-large-xlsr-53モデルをcommon_voiceデータセットで微調整した中国語(普通話)の音声認識モデルです。
ダウンロード数 25
リリース時間 : 3/2/2022

モデル概要

このモデルは主に中国語(普通話)の音声認識タスクに使用され、Facebookのwav2vec2アーキテクチャをベースに微調整されています。

モデル特徴

wav2vec2アーキテクチャをベースに
Facebookのwav2vec2-large-xlsr-53アーキテクチャを採用し、良好な音声認識の基礎を持っています。
中国語(普通話)最適化
中国語(普通話)の音声特性に合わせて特別に微調整されています。
オープンソースライセンス
Apache 2.0ライセンスを使用しており、商用および研究用途が許可されています。

モデル能力

中国語(普通話)音声認識
音声からテキストへの変換

使用事例

音声書き起こし
中国語(普通話)音声をテキストに変換
中国語(普通話)の音声内容をテキストに変換します。
音声アシスタント
中国語(普通話)音声インタラクション
中国語(普通話)の音声アシスタントの構築に使用できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase