faster-whisper-baseオープンソース音声認識モデル - 無料でデプロイして効率的な音声認識タスクを実現

ホーム

Faster Whisper Base

Systranによって開発

これはOpenAI WhisperベースモデルのCTranslate2変換バージョンで、効率的な音声認識タスクに使用されます。

音声認識複数言語対応オープンソースライセンス:MIT #多言語音声認識 #リアルタイム音声書き起こし #FP16効率的推論

ダウンロード数 1.1M

リリース時間 : 11/23/2023

モデル概要

Whisperは自動音声認識(ASR)システムで、複数言語の音声書き起こしを処理するように訓練されています。このバージョンはCTranslate2で最適化され、より効率的な推論性能を提供します。

モデル特徴

多言語サポート

96言語の音声認識をサポート

効率的な推論

CTranslate2による最適化で、オリジナル実装よりも高速な推論速度を提供

FP16量子化

モデル重みをFP16フォーマットで保存し、精度と性能のバランスを実現

モデル能力

音声からテキストへ

多言語音声認識

リアルタイム音声書き起こし

使用事例

音声書き起こし

会議議事録

会議録音を自動的に書き起こし

正確な会議議事録を生成

字幕生成

動画コンテンツの字幕を生成

多言語字幕をサポート

音声アシスタント

音声コマンド認識

ユーザーの音声コマンドを認識

高精度なコマンド認識

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Faster Whisper Base

モデル概要

モデル特徴

モデル能力

使用事例

🚀 CTranslate2用Whisperベースモデル

🚀 クイックスタート

💻 使用例

基本的な使用法

🔧 技術詳細

変換の詳細

📚 ドキュメント

📄 ライセンス