Whisper Base.en
WhisperはOpenAIが訓練した汎用音声認識モデルです。大規模な弱教師あり学習に基づいており、複数言語の音声転写をサポートします。
ダウンロード数 76
リリース時間 : 5/24/2024
モデル概要
Whisper BaseはWhisperシリーズの小型英語専用音声認識モデルで、英語音声から文字への変換タスクに適しています。
モデル特徴
英語専用
英語音声に最適化されたモデルで、英語認識タスクで優れた性能を発揮します
軽量
BaseバージョンはWhisperシリーズの小型モデルで、リソースが限られた環境に適しています
ONNXサポート
ONNX形式に変換済みで、Web環境で効率的に動作します
モデル能力
英語音声認識
音声から文字への変換
リアルタイム転写
使用事例
音声転写
会議議事録
英語会議内容を自動転写
正確な会議議事録を生成
ポッドキャスト字幕
英語ポッドキャストの自動字幕生成
ポッドキャストのアクセシビリティ向上
支援ツール
音声メモ
音声メモを文字に変換
検索や整理が容易に
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98