Wav2vec2 Custom Model 50
W
Wav2vec2 Custom Model 50
Developed by PrajwalS
facebook/wav2vec2-large-960h-lv60-selfを基にファインチューニングした音声認識モデル
Downloads 22
Release Time : 5/6/2022
Model Overview
このモデルはwav2vec2-large-960h-lv60-selfアーキテクチャを基にファインチューニングした音声認識モデルで、主に自動音声認識(ASR)タスクに使用されます。
Model Features
効率的なファインチューニング
事前学習済みの大規模wav2vec2モデルを基にファインチューニングしており、元モデルの強力な特徴抽出能力を保持しています
最適化されたトレーニングパラメータ
学習率、バッチサイズ、オプティマイザ設定など、慎重に調整されたハイパーパラメータの組み合わせを使用しています
Model Capabilities
音声認識
オーディオ特徴抽出
Use Cases
音声からテキストへ
会議議事録
会議の録音を自動的にテキスト記録に変換
字幕生成
動画コンテンツに自動的に字幕を生成
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98