Whisper Smallオープンソース音声認識モデル - 無料で音声を迅速かつ正確にテキストに変換

ホーム

Whisper Small

Xenovaによって開発

Whisper SmallはOpenAIが開発した小型の自動音声認識（ASR）モデルで、音声をテキストに変換できます。

音声認識

Transformers

#音声からテキストへ #多言語対応 #ウェブ対応

ダウンロード数 1,716

リリース時間 : 5/3/2023

モデル概要

Whisper Smallは効率的な音声認識モデルで、多言語の音声文字起こしタスクに適しています。

モデル特徴

多言語対応

複数言語の音声認識をサポートし、国際的なアプリケーションシーンに適しています。

効率的な文字起こし

モデルは最適化されており、高い精度を維持しながら迅速な音声文字起こしを実現します。

ONNX互換

モデルはONNX形式に変換されており、Transformers.jsとの互換性が保証され、ウェブ展開に適しています。

モデル能力

音声認識

多言語文字起こし

リアルタイム音声からテキストへ

使用事例

音声文字起こし

会議議事録

会議の録音をリアルタイムでテキストに変換し、記録や後からの参照を容易にします。

会議の効率を向上させ、手動での記録作業を削減します。

字幕生成

動画コンテンツに自動的に字幕を生成し、アクセシビリティを向上させます。

手作業での字幕作成時間を節約し、コンテンツのアクセシビリティを高めます。

音声アシスタント

音声コマンド認識

スマートデバイスでの音声コマンド認識に使用され、音声制御機能を実現します。

ユーザー体験を向上させ、より自然なインタラクションを可能にします。

属性	详情
ベースモデル	openai/whisper-small
ライブラリ名	transformers.js

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Whisper Small

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Whisper-smallモデルのONNX対応版

🚀 クイックスタート

📚 ドキュメント