W

Wav2vec2 Xls R 300m As CV8 V1

emreによって開発
facebook/wav2vec2-xls-r-300mをCommon Voice 8.0データセットでファインチューニングしたアッサム語(Assamese)音声認識モデル
ダウンロード数 21
リリース時間 : 3/2/2022

モデル概要

このモデルはアッサム語の自動音声認識(ASR)タスク向けに最適化されたモデルで、wav2vec2-xls-r-300mアーキテクチャを基にファインチューニングされています。

モデル特徴

ロバストな音声認識
アッサム語向けに最適化された音声認識能力
Common Voiceデータベース
Mozilla Common Voice 8.0データセットを使用してトレーニング
大規模事前学習モデルのファインチューニング
3億パラメータのwav2vec2-xls-rモデルを基にファインチューニング

モデル能力

アッサム語音声認識
音声からテキストへの変換

使用事例

音声技術アプリケーション
アッサム語音声アシスタント
アッサム語音声インタラクションアプリの開発に使用
音声文字起こしサービス
アッサム語音声コンテンツをテキストに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase