wav2vec2_custom_model_50オープンソース音声認識モデル、無料でデプロイして高精度に音声を文字に変換

Home

Wav2vec2 Custom Model 50

Developed by PrajwalS

facebook/wav2vec2-large-960h-lv60-selfを基にファインチューニングした音声認識モデル

音声認識

Transformers

Open Source License:Apache-2.0 #音声認識ファインチューニング #高精度オーディオ処理 #低リソース適応

Downloads 22

Release Time : 5/6/2022

Model Overview

このモデルはwav2vec2-large-960h-lv60-selfアーキテクチャを基にファインチューニングした音声認識モデルで、主に自動音声認識(ASR)タスクに使用されます。

Model Features

効率的なファインチューニング

事前学習済みの大規模wav2vec2モデルを基にファインチューニングしており、元モデルの強力な特徴抽出能力を保持しています

最適化されたトレーニングパラメータ

学習率、バッチサイズ、オプティマイザ設定など、慎重に調整されたハイパーパラメータの組み合わせを使用しています

Model Capabilities

音声認識

オーディオ特徴抽出

Use Cases

音声からテキストへ

会議議事録

会議の録音を自動的にテキスト記録に変換

字幕生成

動画コンテンツに自動的に字幕を生成

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers Supports Multiple Languages

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Wav2vec2 Custom Model 50

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 wav2vec2_custom_model_50

🚀 クイックスタート

📚 ドキュメント

モデルの説明

想定される用途と制限

学習と評価データ

学習手順

学習ハイパーパラメータ

学習結果

フレームワークのバージョン

📄 ライセンス