faster-whisper-smallオープンソース音声認識モデル - 効率的な形式変換で、無料で正確な音声認識を実現

ホーム

Faster Whisper Small

Systranによって開発

OpenAI Whisper小型モデルのCTranslate2フォーマット変換版、効率的な音声認識用

音声認識複数言語対応オープンソースライセンス:MIT #多言語音声転写 #リアルタイム音声認識 #FP16効率的推論

ダウンロード数 376.48k

リリース時間 : 11/23/2023

モデル概要

これは自動音声認識(ASR)モデルで、多言語音声からテキストへの変換タスクをサポートし、CTranslate2による最適化で効率的な推論を実現

モデル特徴

多言語サポート

100以上の言語の音声認識をサポート

効率的な推論

CTranslate2による最適化でより高速な推論を実現

FP16量子化

モデル重みをFP16フォーマットで保存、精度と性能のバランスを実現

簡単な統合

Python APIを提供し、既存アプリケーションに簡単に統合可能

モデル能力

音声からテキストへ

多言語認識

リアルタイム転写

オーディオファイル処理

使用事例

音声転写

会議議事録

会議内容を自動記録し文字原稿を生成

議事録作成効率向上、手動転写時間削減

ポッドキャスト転写

ポッドキャスト音声コンテンツを検索可能なテキストに変換

コンテンツの索引付けと検索が容易に

多言語アプリケーション

国際カスタマーサポート

多言語カスタマー通話を自動転写

グローバルビジネスの多言語コミュニケーションをサポート

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Faster Whisper Small

モデル概要

モデル特徴

モデル能力

使用事例

🚀 CTranslate2用Whisper小規模モデル

🚀 クイックスタート

💻 使用例

基本的な使用法

🔧 技術詳細

変換詳細

📚 ドキュメント

📄 ライセンス