Whisper Tinyオープンソース音声認識モデル - 無料のウェブ端でのデプロイで、効率的な音声認識を実現

ホーム

Whisper Tiny

Xenovaによって開発

Whisper TinyはOpenAIがオープンソースで公開した軽量音声認識モデルで、ウェブデプロイに適しています。

音声認識

Transformers

#音声からテキストへ #ウェブデプロイ #ONNXフォーマット

ダウンロード数 21.70k

リリース時間 : 5/3/2023

モデル概要

Whisper Tinyは軽量な自動音声認識（ASR）モデルで、音声をテキストに変換する機能をサポートし、リアルタイムまたはオフラインの音声認識シナリオに適しています。

モデル特徴

軽量設計

モデルサイズが小さく、ウェブ端末やリソースが限られた環境でのデプロイに適しています。

ONNXフォーマット対応

ONNXフォーマットの重みを提供しており、WebML環境での使用が容易です。

多言語対応

複数言語の音声認識をサポートしています（具体的な言語は不明）。

モデル能力

音声からテキストへ

リアルタイム音声認識

オフライン音声認識

使用事例

音声書き起こし

会議議事録

会議の録音をリアルタイムでテキスト記録に変換します。

字幕生成

動画コンテンツに自動的に字幕を生成します。

音声アシスタント

ウェブ音声入力

ウェブアプリケーションで音声入力機能を実現します。

属性	详情
モデルタイプ	openai/whisper-tiny
ライブラリ名	transformers.js

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Whisper Tiny

モデル概要

モデル特徴

モデル能力

使用事例

🚀 ウィスパーモデルのONNX版

📦 インストール

💻 使用例

📚 ドキュメント

モデル情報

注意事項

参考リンク