W

Wav2vec2 Large Voxrex Swedish 4gram

viktor-enzellによって開発
これはスウェーデン語の自動音声認識(ASR)用モデルで、VoxRex-C音響モデルとソーシャルメディアデータに基づく4-gram言語モデルを統合しています。
ダウンロード数 5,891
リリース時間 : 5/26/2022

モデル概要

このモデルは、スウェーデン文化グループの10億語コーパスに基づく4-gram言語モデルを追加することでVoxRex-C音響モデルの性能を強化し、特にスウェーデン語音声認識タスクに特化しています。

モデル特徴

強化された言語モデル
4000万のソーシャルメディア語彙に基づく4-gram言語モデルを統合し、認識精度を大幅に向上
高性能
公共音声6.1テストセットで6.47%の単語誤り率を達成
事前学習済み音響モデル
VoxRex-C事前学習モデルベースで、優れた音響特徴抽出能力を有する

モデル能力

スウェーデン語音声認識
音声文字起こし
16kHz音声処理

使用事例

音声文字起こし
ソーシャルメディア音声文字起こし
ソーシャルメディアプラットフォーム上のスウェーデン語音声コンテンツをテキストに変換
非公式な口語表現の処理に適している
音声アシスタント
スウェーデン語音声アシスタントアプリケーションの音声認識コンポーネントとして使用
高精度な音声コマンド認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase