faster-whisper-smallオープンソース音声認識モデル - 無料でデプロイして多言語文字起こしを実現

Faster Whisper Small

guillaumeklnによって開発

Transformerアーキテクチャに基づく自動音声認識（ASR）モデルで、多言語の文字起こしに対応しています。

音声認識複数言語対応オープンソースライセンス:MIT #多言語音声認識 #高効率推論 #軽量モデル

ダウンロード数 4,599

リリース時間 : 3/23/2023

モデル概要

Whisper SmallはOpenAIによって開発された自動音声認識モデルで、音声をテキストに変換し、複数の言語の文字起こしタスクをサポートします。このモデルはTransformerアーキテクチャを採用しており、高い精度と効率を備えています。

モデル特徴

多言語対応

100種以上の言語の音声認識をサポートします。

高効率変換

CTranslate2形式で最適化され、より高速な推論速度を提供します。

FP16量子化

モデルの重みはFP16形式で保存され、精度とパフォーマンスをバランスさせます。

モデル能力

音声からテキストへの変換

多言語文字起こし

オーディオコンテンツ分析

使用事例

文字起こしサービス

会議記録

会議の録音を自動的に文字記録に変換します。

字幕生成

ビデオコンテンツに自動的に字幕を生成します。

音声分析

音声アシスタント

音声アシスタントの基本的な認識コンポーネントとして使用します。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Faster Whisper Small

モデル概要

モデル特徴

モデル能力

使用事例

🚀 CTranslate2用Whisper smallモデル

🚀 クイックスタート

💻 使用例

基本的な使用法

🔧 技術詳細

変換の詳細

📚 ドキュメント

📄 ライセンス