Whisperkit Coreml
WhisperKit は Apple Silicon 向けのローカル音声認識フレームワークで、効率的な自動音声認識タスクをサポートします。
ダウンロード数 296.02k
リリース時間 : 2/28/2024
モデル概要
WhisperKit は Apple Silicon に最適化されたローカル音声認識フレームワークで、効率的な自動音声認識(ASR)機能を提供します。
モデル特徴
Apple Silicon 最適化
Apple Silicon 専用に設計されており、効率的なローカル音声認識性能を提供します。
CoreML サポート
CoreML をサポートし、Apple デバイスで効率的に動作します。
量子化モデル
量子化モデルを提供し、メモリ使用量を削減し推論速度を向上させます。
ビジネスアップグレード版
より高い需要を持つユーザー向けに WhisperKit Pro ビジネスアップグレード版を提供します。
モデル能力
音声認識
自動音声テキスト変換
ローカル処理
使用事例
音声テキスト変換
リアルタイム音声書き起こし
リアルタイム音声をテキストに変換し、会議議事録やメモなどのシナリオに適しています。
オーディオファイル書き起こし
オーディオファイル内の音声内容をテキストに変換し、字幕生成やコンテンツ分析などに適しています。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98