sentis - whisper - tinyオープンソース音声テキスト変換モデル - Unity環境での音声認識に無料で使用可能

ホーム

Sentis Whisper Tiny

unityによって開発

Whisper-TinyはOpenAIが開発した小型の自動音声認識(ASR)モデルで、音声からテキストへの変換タスク向けに設計されており、Unity環境に適しています。

音声認識オープンソースライセンス:Apache-2.0 #リアルタイム音声テキスト変換 #Unityエンジン統合 #16kHzオーディオ処理

ダウンロード数 253

リリース時間 : 1/11/2024

モデル概要

このモデルは16kHzのwavオーディオを文字に転写でき、軽量な音声認識ソリューションが必要な場面に適しています。

モデル特徴

軽量設計

Whisperシリーズで最小のモデルであり、リソースが限られた環境に適しています。

Unity統合

Unity 6とSentis 2.1環境向けに最適化されており、ゲーム開発者が使いやすいです。

リアルタイム転写

16kHzのwavオーディオストリームを処理し、ほぼリアルタイムで音声をテキストに変換できます。

モデル能力

音声認識

オーディオ転写

リアルタイム音声処理

使用事例

ゲーム開発

ゲーム音声コントロール

音声コマンドでゲームキャラクターやインターフェースを制御

ゲームのインタラクション体験を向上

アプリ開発

音声メモアプリ

ユーザーの音声入力をリアルタイムでテキストメモに変換

入力効率を向上

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Sentis Whisper Tiny

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Unity SentisにおけるWhisper-Tinyモデル (バージョン2.1)

📄 ライセンス