WhisperKit - coremlオープンソース音声認識フレームワーク - Apple Siliconでの高速音声認識をサポート

ホーム

Whisperkit Coreml

argmaxincによって開発

WhisperKit は Apple Silicon 向けのローカル音声認識フレームワークで、効率的な自動音声認識タスクをサポートします。

音声認識その他#Apple Silicon最適化 #ローカル音声認識 #ビジネスアップグレード版

ダウンロード数 296.02k

リリース時間 : 2/28/2024

モデル概要

WhisperKit は Apple Silicon に最適化されたローカル音声認識フレームワークで、効率的な自動音声認識（ASR）機能を提供します。

モデル特徴

Apple Silicon 最適化

Apple Silicon 専用に設計されており、効率的なローカル音声認識性能を提供します。

CoreML サポート

CoreML をサポートし、Apple デバイスで効率的に動作します。

量子化モデル

量子化モデルを提供し、メモリ使用量を削減し推論速度を向上させます。

ビジネスアップグレード版

より高い需要を持つユーザー向けに WhisperKit Pro ビジネスアップグレード版を提供します。

モデル能力

音声認識

自動音声テキスト変換

ローカル処理

使用事例

音声テキスト変換

リアルタイム音声書き起こし

リアルタイム音声をテキストに変換し、会議議事録やメモなどのシナリオに適しています。

オーディオファイル書き起こし

オーディオファイル内の音声内容をテキストに変換し、字幕生成やコンテンツ分析などに適しています。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Whisperkit Coreml

モデル概要

モデル特徴

モデル能力

使用事例

🚀 WhisperKit