E

Exp W2v2t It Xlsr 53 S387

jonatasgrosmanによって開発
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。
ダウンロード数 18
リリース時間 : 7/8/2022

モデル概要

このモデルはイタリア語の自動音声認識(ASR)タスク向けに最適化されたモデルで、XLSR-53アーキテクチャをベースにファインチューニングされており、16kHzサンプリングレートの音声入力に適しています。

モデル特徴

イタリア語最適化
イタリア語音声認識タスク向けに特別にファインチューニングされています
XLSR-53アーキテクチャベース
facebookのwav2vec2-large-xlsr-53事前トレーニングモデルをベースにしています
16kHzサンプリングレート対応
最適な結果を得るためには16kHzサンプリングレートの音声入力が必要です

モデル能力

イタリア語音声からテキストへの変換
自動音声認識

使用事例

音声文字起こし
イタリア語音声文字起こし
イタリア語の音声コンテンツをテキストに変換します
音声アシスタント
イタリア語音声コマンド認識
イタリア語音声アシスタントシステムでのコマンド認識に使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase