W

Wav2vec2 Large Xlsr 53 Finnish

Tommiによって開発
facebook/wav2vec2-large-xlsr-53モデルをベースに微調整されたフィンランド語自動音声認識モデルで、16kHzサンプリングレートの音声入力に対応しています。
ダウンロード数 28
リリース時間 : 3/2/2022

モデル概要

このモデルはフィンランド語に最適化された自動音声認識(ASR)モデルで、XLSR - 53アーキテクチャに基づき、一般音声コーパス、CSS10、フィンランド議会会議記録などのデータセットで微調整されています。

モデル特徴

複数データセットの微調整
一般音声コーパス、CSS10、フィンランド議会会議記録の3つのデータセットを組み合わせて学習を行い、モデルの適応性を向上させます。
言語モデル不要
追加の言語モデルのサポートなしで、直接音声認識に使用できます。
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力に特化して最適化されています。

モデル能力

フィンランド語音声認識
音声からテキストへの変換
音声内容分析

使用事例

音声文字起こし
会議記録の自動文字起こし
フィンランド議会会議などの正式な場面の音声内容をテキストに変換します。
音声メモの変換
個人の音声メモを編集可能なテキストに変換します。
音声アシスタント
フィンランド語音声指令認識
フィンランド語音声アシスタントに核心的な認識能力を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase