whisper-large-v3-turboオープンソース音声認識モデル - Webブラウザ用に最適化されたONNX形式

ホーム

Whisper Large V3 Turbo

onnx-communityによって開発

ONNX形式で最適化されたWhisper大規模音声認識モデル、ウェブ展開向けに設計

音声認識

Transformers

#音声テキスト変換 #多言語対応 #ONNX最適化

ダウンロード数 2,988

リリース時間 : 10/1/2024

モデル概要

OpenAI Whisperの最適化版、効率的な音声テキスト変換をサポート、ONNX形式によりTransformers.jsと互換性確保

モデル特徴

ウェブ最適化

ONNX重みフォーマット採用、Transformers.js向け設計、ブラウザ環境での実行に適している

効率的な推論

Turbo版は推論速度を最適化、リアルタイム音声テキスト変換に適している

多言語対応

Whisperアーキテクチャベース、複数言語の音声認識をサポート

モデル能力

音声テキスト変換

多言語音声認識

リアルタイム音声処理

使用事例

音声文字起こし

会議議録自動化

会議録音をリアルタイムで文字起こし

議録作成効率向上、多言語会議をサポート

ポッドキャスト字幕生成

ポッドキャスト音声から自動で字幕生成

コンテンツアクセシビリティ向上、SEO最適化をサポート

音声アシスタント

ブラウザ音声制御

ウェブアプリで音声制御機能を実現

サーバー側処理不要、ユーザープライバシー保護

属性	详情
ベースモデル	openai/whisper-large-v3-turbo
ライブラリ名	transformers.js

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Whisper Large V3 Turbo

モデル概要

モデル特徴

モデル能力

使用事例

🚀 openai/whisper-large-v3-turbo for Transformers.js

🚀 クイックスタート