W

W2V2 BERT Withlm Malayalam

vrclcによって開発
facebook/w2v-bert-2.0をベースにファインチューニングしたマラヤーラム語自動音声認識モデルで、複数のマラヤーラム語データセットで訓練され、KENLMライブラリで訓練された3-gram言語モデルを使用しています。
ダウンロード数 65
リリース時間 : 7/11/2024

モデル概要

これはマラヤーラム語の自動音声認識モデルで、facebook/w2v-bert-2.0アーキテクチャをベースにファインチューニングされており、マラヤーラム語音声をテキストに変換するのに適しています。

モデル特徴

複数データセット訓練
IMaSC、MSC、OpenSLRマラヤーラム語訓練セット、Festvoxマラヤーラム語、CV16など複数のデータセットでファインチューニング
言語モデル強化
KENLMライブラリを使用してml-sentencesデータセットで訓練された3-gram言語モデル
低単語誤り率
OpenSLRテストセットで12.99%の単語誤り率を達成

モデル能力

マラヤーラム語音声認識
音声からテキストへ

使用事例

音声文字起こし
マラヤーラム語音声文字起こし
マラヤーラム語音声をテキストに変換
OpenSLRテストセットで単語誤り率18.23%
音声アシスタント
マラヤーラム語音声アシスタント
マラヤーラム語音声インタラクションをサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase