faster-whisper-mediumオープンソースモデル - 無料でデプロイして効率的な音声認識アプリケーションを実現

ホーム

Faster Whisper Medium

guillaumeklnによって開発

本プロジェクトはopenai/whisper-mediumモデルをCTranslate2モデル形式に変換し、高効率な音声認識に使用できます。

音声認識複数言語対応オープンソースライセンス:MIT #多言語音声認識 #高効率推論加速 #FP16量子化

ダウンロード数 15.17k

リリース時間 : 3/23/2023

モデル概要

OpenAI Whisper-mediumモデルを基に変換されたCTranslate2形式のモデルで、多言語音声認識タスクをサポートします。

モデル特徴

高効率推論

CTranslate2による最適化により、元のモデルよりも高速な推論速度を提供します。

多言語サポート

90種類以上の言語の音声認識をサポートします。

量子化サポート

FP16量子化をサポートし、compute_typeオプションでデータ型を調整できます。

モデル能力

音声をテキストに変換

多言語認識

長い音声データの処理

使用事例

音声文字起こし

会議記録

会議の録音を自動的に文字起こしします。

高い精度で、多言語の会議に対応します。

ポッドキャスト字幕生成

ポッドキャストの内容に自動的に字幕を生成します。

複数の言語のポッドキャスト内容に対応します。

音声アシスタント

音声コマンド認識

ユーザーの音声コマンドを認識します。

低遅延で応答します。

🚀 CTranslate2用Whisperミディアムモデル

このリポジトリには、openai/whisper-medium を CTranslate2 のモデル形式に変換したものが含まれています。このモデルは、CTranslate2 または faster-whisper のような CTranslate2 ベースのプロジェクトで使用できます。

🚀 クイックスタート

このモデルは、CTranslate2 または CTranslate2 をベースにしたプロジェクトで使用できます。以下に使用例を示します。

💻 使用例

基本的な使用法

from faster_whisper import WhisperModel

model = WhisperModel("medium")

segments, info = model.transcribe("audio.mp3")
for segment in segments:
    print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))

🔧 技術詳細

変換詳細

元のモデルは、以下のコマンドで変換されました。

ct2-transformers-converter --model openai/whisper-medium --output_dir faster-whisper-medium \
    --copy_files tokenizer.json --quantization float16

モデルの重みは FP16 で保存されています。この型は、CTranslate2 の compute_type オプションを使用してモデルを読み込む際に変更できます。

その他の情報

元のモデルに関する詳細情報は、モデルカードを参照してください。

📄 ライセンス

このプロジェクトは MIT ライセンスの下で提供されています。

サポート言語

言語
英語 (en)
中国語 (zh)
ドイツ語 (de)
スペイン語 (es)
ロシア語 (ru)
韓国語 (ko)
フランス語 (fr)
日本語 (ja)
ポルトガル語 (pt)
トルコ語 (tr)
ポーランド語 (pl)
カタルーニャ語 (ca)
オランダ語 (nl)
アラビア語 (ar)
スウェーデン語 (sv)
イタリア語 (it)
インドネシア語 (id)
ヒンディー語 (hi)
フィンランド語 (fi)
ベトナム語 (vi)
ヘブライ語 (he)
ウクライナ語 (uk)
ギリシャ語 (el)
マレー語 (ms)
チェコ語 (cs)
ルーマニア語 (ro)
デンマーク語 (da)
ハンガリー語 (hu)
タミル語 (ta)
ノルウェー語 (no)
タイ語 (th)
ウルドゥー語 (ur)
クロアチア語 (hr)
ブルガリア語 (bg)
リトアニア語 (lt)
ラテン語 (la)
マオリ語 (mi)
マラヤーラム語 (ml)
ウェールズ語 (cy)
スロバキア語 (sk)
テルグ語 (te)
ペルシャ語 (fa)
ラトビア語 (lv)
ベンガル語 (bn)
セルビア語 (sr)
アゼルバイジャン語 (az)
スロベニア語 (sl)
カンナダ語 (kn)
エストニア語 (et)
マケドニア語 (mk)
ブルトン語 (br)
バスク語 (eu)
アイスランド語 (is)
アルメニア語 (hy)
ネパール語 (ne)
モンゴル語 (mn)
ボスニア語 (bs)
カザフ語 (kk)
アルバニア語 (sq)
スワヒリ語 (sw)
ガリシア語 (gl)
マラーティー語 (mr)
パンジャブ語 (pa)
シンハラ語 (si)
クメール語 (km)
ショナ語 (sn)
ヨルバ語 (yo)
ソマリ語 (so)
アフリカーンス語 (af)
オック語 (oc)
グルジア語 (ka)
ベラルーシ語 (be)
タジク語 (tg)
サンスクリット語 (sd)
グジャラート語 (gu)
アムハラ語 (am)
イディッシュ語 (yi)
ラオス語 (lo)
ウズベク語 (uz)
フェロー語 (fo)
ハイチ語 (ht)
パシュトー語 (ps)
トルクメン語 (tk)
ニーノルウェー語 (nn)
マルタ語 (mt)
サンスクリット語 (sa)
ルクセンブルク語 (lb)
ミャンマー語 (my)
チベット語 (bo)
タガログ語 (tl)
マダガスカル語 (mg)
アッサム語 (as)
タタール語 (tt)
ハワイ語 (haw)
リンガラ語 (ln)
ハウサ語 (ha)
バシキール語 (ba)
ジャワ語 (jw)
スンダ語 (su)