wav2vec2-large-xls-r-300m-slovenianオープンソース音声認識モデル

ホーム

Wav2vec2 Large Xls R 300m Slovenian

bekirbakarによって開発

このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceスロベニア語データセットでファインチューニングした音声認識モデルで、単語誤り率は0.3271です。

音声認識

Transformers

オープンソースライセンス:Apache-2.0 #スロベニア語音声認識 #高精度音声テキスト変換 #多言語事前学習ファインチューニング

ダウンロード数 278

リリース時間 : 6/6/2022

モデル概要

スロベニア語に最適化された音声認識モデルで、wav2vec2-xls-r-300mアーキテクチャを基にファインチューニングされており、音声テキスト変換タスクに適しています。

モデル特徴

高性能音声認識

common_voiceスロベニア語データセットで0.3271の単語誤り率を達成

大規模モデルベースのファインチューニング

3億パラメータのwav2vec2-xls-r-300mモデルを基にファインチューニングし、元モデルの強力な特徴抽出能力を継承

最適化されたトレーニングプロセス

線形学習率スケジューリングと500ステップのウォームアップを採用し、20エポックで最適な効果を達成

モデル能力

スロベニア語音声認識

音声テキスト変換

音声内容分析

使用事例

音声文字起こし

会議議録自動化

スロベニア語の会議録音を自動的に文字記録に変換

約67.29%の精度

音声アシスタント

スロベニア語ユーザー向けに音声インタラクションをサポート

教育技術

言語学習アプリケーション

学習者がスロベニア語の発音とリスニングを練習するのを支援

トレーニング損失 (Training Loss)	エポック (Epoch)	ステップ (Step)	検証損失 (Validation Loss)	単語誤り率 (Wer)
4.3681	4.93	400	0.7067	0.6486
0.2311	9.87	800	0.5155	0.4341
0.0833	14.81	1200	0.4996	0.3799
0.0455	19.75	1600	0.4462	0.3271

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Wav2vec2 Large Xls R 300m Slovenian

モデル概要

モデル特徴

モデル能力

使用事例

🚀 wav2vec2-large-xls-r-300m-slovenian

📚 詳細ドキュメント

トレーニング手順

トレーニングハイパーパラメータ

トレーニング結果

フレームワークバージョン

📄 ライセンス