W

Wav2vec2 Large Xlsr Malayalam

gvsによって開発
facebook/wav2vec2-large-xlsr-53を基にマラヤーラム語でファインチューニングした音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
ダウンロード数 29.57k
リリース時間 : 3/2/2022

モデル概要

これはマラヤーラム語に最適化された自動音声認識モデルで、XLSR-53アーキテクチャを基にファインチューニングされており、マラヤーラム語の音声からテキストへの変換タスクに適しています。

モデル特徴

マルチデータセットトレーニング
4つの異なるマラヤーラム語音声データセットを使用してトレーニングを行い、モデルの汎化能力を向上させました。
低い単語誤り率
組み合わせテストセットで28.43%の単語誤り率を達成し、良好なパフォーマンスを示しています。
すぐに使えるモデル
追加の言語モデルがなくても直接使用可能で、導入プロセスを簡素化しています。

モデル能力

マラヤーラム語音声認識
16kHz音声処理
自動音声テキスト変換

使用事例

音声書き起こし
マラヤーラム語音声転写
マラヤーラム語の音声コンテンツをテキストに変換
28.43%単語誤り率
音声アシスタント
ローカライズされた音声インタラクション
マラヤーラム語ユーザー向けの音声インタラクションサポートを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase