W

Wav2vec2 Large Xlsr Greek 1

skylordによって開発
facebook/wav2vec2-large-xlsr-53を基にギリシャ語でファインチューニングした音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
ダウンロード数 15
リリース時間 : 3/2/2022

モデル概要

これはギリシャ語に最適化された自動音声認識(ASR)モデルで、XLSR-53アーキテクチャを基にファインチューニングされており、ギリシャ語の音声からテキストへの変換タスクに適しています。

モデル特徴

ギリシャ語最適化
ギリシャ語に特化してファインチューニングされており、より優れたギリシャ語音声認識性能を提供します
16kHzサンプリングレートサポート
16kHzサンプリングレートの音声入力をサポートし、一般的な音声アプリケーションシナリオに適しています
XLSR-53アーキテクチャベース
強力なXLSR-53事前学習モデルを利用してファインチューニングされており、優れた音声特徴抽出能力を備えています

モデル能力

ギリシャ語音声認識
音声からテキストへの変換
自動音声認識

使用事例

音声書き起こし
ギリシャ語音声書き起こし
ギリシャ語の音声コンテンツをテキストに変換
Common Voiceギリシャ語テストセットでWERが34.01%
音声アシスタント
ギリシャ語音声コマンド認識
ギリシャ語音声アシスタントのフロントエンド音声認識モジュールとして使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase