Faster Whisper Large V2
Whisper large-v2はOpenAIが開発した大規模自動音声認識(ASR)モデルで、複数言語の音声から文字への変換タスクをサポートします。
ダウンロード数 948.29k
リリース時間 : 11/23/2023
モデル概要
このモデルはTransformerアーキテクチャに基づく自動音声認識システムで、音声をテキストに変換し、複数の言語とアクセントをサポートします。
モデル特徴
多言語サポート
100以上の言語の音声認識をサポート
効率的な推論
CTranslate2による最適化で、より高速な推論を提供
高精度
複数の言語とアクセントで優れた認識精度を発揮
FP16量子化
モデル重みをFP16形式で保存し、精度と性能のバランスを実現
モデル能力
音声から文字へ
多言語認識
リアルタイム転写
オーディオファイル処理
使用事例
メディア転写
ポッドキャスト転写
ポッドキャストの音声コンテンツを自動的に文字原稿に変換
コンテンツのアクセシビリティとSEO最適化の向上
動画字幕生成
動画コンテンツに自動的に字幕を生成
動画のアクセシビリティと多言語サポートの向上
会議記録
会議記録の自動化
会議内容をリアルタイムで転写
会議効率と記録精度の向上
カスタマーサービス
音声カスタマーサービス記録
カスタマーサービス通話を自動記録・分析
サービス品質分析とトレーニング効率の向上
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98