Faster Whisper Large V2
Whisper large-v2はOpenAIが開発した大規模自動音声認識(ASR)モデルで、複数言語の音声から文字への変換タスクをサポートします。
Downloads 948.29k
Release Time : 11/23/2023
Model Overview
このモデルはTransformerアーキテクチャに基づく自動音声認識システムで、音声をテキストに変換し、複数の言語とアクセントをサポートします。
Model Features
多言語サポート
100以上の言語の音声認識をサポート
効率的な推論
CTranslate2による最適化で、より高速な推論を提供
高精度
複数の言語とアクセントで優れた認識精度を発揮
FP16量子化
モデル重みをFP16形式で保存し、精度と性能のバランスを実現
Model Capabilities
音声から文字へ
多言語認識
リアルタイム転写
オーディオファイル処理
Use Cases
メディア転写
ポッドキャスト転写
ポッドキャストの音声コンテンツを自動的に文字原稿に変換
コンテンツのアクセシビリティとSEO最適化の向上
動画字幕生成
動画コンテンツに自動的に字幕を生成
動画のアクセシビリティと多言語サポートの向上
会議記録
会議記録の自動化
会議内容をリアルタイムで転写
会議効率と記録精度の向上
カスタマーサービス
音声カスタマーサービス記録
カスタマーサービス通話を自動記録・分析
サービス品質分析とトレーニング効率の向上
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98