Wav2vec2 2 Bert Large

W

Wav2vec2 2 Bert Large

speech-seq2seqによって開発

LibriSpeechデータセットでトレーニングされた自動音声認識(ASR)モデルで、英語音声をテキストに変換します

#低い単語誤り率 #英語音声認識 #線形学習率スケジューリング

ダウンロード数 17

リリース時間 : 3/2/2022

モデル概要

このモデルは英語音声に特化した自動音声認識システムで、音声信号を対応するテキスト内容に変換できます。

モデル特徴

高精度

LibriSpeech評価セットで1.9878の単語誤り率を達成

最適化トレーニング

Adamオプティマイザーと線形学習率スケジューラーを使用してトレーニング

モデル能力

英語音声認識

連続音声テキスト変換

使用事例

音声文字起こし

音声文字変換

英語音声内容を自動的にテキスト形式に変換

単語誤り率1.9878

支援ツール

リアルタイム字幕生成

英語動画や会議にリアルタイム字幕を提供

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase