exp_w2v2t_sv - se_r - wav2vec2_s418オープンソースモデル - 16kHz音声に対応したスウェーデン語の自動認識

ホーム

Exp W2v2t Sv Se R Wav2vec2 S418

jonatasgrosmanによって開発

facebook/wav2vec2-large-robustモデルをファインチューニングしたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。

音声認識

Transformers

オープンソースライセンス:Apache-2.0 #スウェーデン語音声認識 #高ロバスト性モデル #16kHzサンプリングレート対応

ダウンロード数 32

リリース時間 : 7/9/2022

モデル概要

このモデルはスウェーデン語の自動音声認識（ASR）タスク向けに最適化されており、wav2vec2-large-robustアーキテクチャを基に、Common Voice 7.0スウェーデン語データセットでファインチューニングされています。

モデル特徴

スウェーデン語最適化

スウェーデン語に特化してファインチューニングされており、より正確な音声認識能力を提供します。

16kHzサンプリングレートサポート

16kHzサンプリングレートの音声入力をサポートし、一般的な音声収集デバイスに対応しています。

wav2vec2-large-robustベース

強力なwav2vec2-large-robustアーキテクチャを基にしており、優れた音声特徴抽出能力を備えています。

モデル能力

スウェーデン語音声認識

音声からテキストへの変換

使用事例

音声文字起こし

スウェーデン語会議議事録

スウェーデン語の会議録音を自動的にテキストに変換

音声アシスタント

スウェーデン語音声アシスタントに音声認識能力を提供

アクセシビリティアプリケーション

聴覚支援

スウェーデン語音声をリアルタイムで文字に変換

🚀 exp_w2v2t_sv - se_r - wav2vec2_s418

このモデルは、自動音声認識を目的としており、Common Voice 7.0 (sv - SE) のトレーニング分割データを使用して、facebook/wav2vec2-large-robust をファインチューニングしたものです。このモデルを使用する際には、音声入力が16kHzでサンプリングされていることを確認してください。また、このモデルは HuggingSound ツールを使用してファインチューニングされています。

🚀 クイックスタート

このモデルを使用するには、音声入力が16kHzでサンプリングされていることを確認してください。これにより、適切な音声認識結果を得ることができます。

✨ 主な機能

自動音声認識機能を提供します。
facebook/wav2vec2-large-robust をベースに、Common Voice 7.0 (sv - SE) のデータでファインチューニングされています。

📦 インストール

このREADMEには具体的なインストール手順が記載されていないため、このセクションをスキップします。

💻 使用例

このREADMEには具体的なコード例が記載されていないため、このセクションをスキップします。

📚 ドキュメント

このモデルは、自動音声認識を行うために、facebook/wav2vec2-large-robust を Common Voice 7.0 (sv - SE) のトレーニングデータでファインチューニングしたものです。使用する際には、音声入力が16kHzでサンプリングされていることを確認してください。

🔧 技術詳細

このREADMEには具体的な技術詳細が50文字以上記載されていないため、このセクションをスキップします。

📄 ライセンス

このモデルは、Apache 2.0ライセンスの下で提供されています。

属性	详情
モデルタイプ	自動音声認識用にファインチューニングされたモデル
トレーニングデータ	Common Voice 7.0 (sv - SE) のトレーニング分割データ