Whisper - large - v3 - ggufオープンソース音声認識モデル - 無料で多言語の音声からテキストへの変換タスクを完了

ホーム

Whisper Large V3 Gguf

vonjackによって開発

Whisperは多言語自動音声認識（ASR）システムで、複数の言語の音声をテキストに変換するタスクをサポートしています。

音声認識複数言語対応オープンソースライセンス:Apache-2.0 #多言語音声認識 #高精度書き起こし #オフライン展開

ダウンロード数 931

リリース時間 : 5/4/2024

モデル概要

WhisperはTransformerアーキテクチャに基づく自動音声認識モデルで、音声をテキストに変換し、複数の言語をサポートします。

モデル特徴

多言語サポート

100以上の言語の音声認識をサポートしています。

高精度

Transformerアーキテクチャに基づき、高精度な音声からテキストへの変換能力を提供します。

軽量化

GGUFフォーマットによりモデルサイズと推論速度が最適化されています。

モデル能力

音声からテキストへの変換

多言語認識

使用事例

音声書き起こし

会議議事録

会議の録音をテキスト記録に変換します。

高精度な書き起こし結果で、複数の言語をサポートします。

字幕生成

動画コンテンツの字幕を生成します。

迅速に多言語字幕を生成します。

音声アシスタント

音声コマンド認識

ユーザーの音声コマンドを認識し、対応する操作を実行します。

高速な応答速度と高い精度を実現します。

🚀 Whisper

このプロジェクトは、whisper.cpp用のGGUFsを提供しています。自動音声認識に役立つリソースです。

🚀 クイックスタート

このプロジェクトは自動音声認識に特化しており、以下の機能を提供します。

サポート言語

英語 (en)
中国語 (zh)
ドイツ語 (de)
スペイン語 (es)
ロシア語 (ru)
韓国語 (ko)
フランス語 (fr)
日本語 (ja)
ポルトガル語 (pt)
トルコ語 (tr)
ポーランド語 (pl)
カタルーニャ語 (ca)
オランダ語 (nl)
アラビア語 (ar)
スウェーデン語 (sv)
イタリア語 (it)
インドネシア語 (id)
ヒンディー語 (hi)
フィンランド語 (fi)
ベトナム語 (vi)
ヘブライ語 (he)
ウクライナ語 (uk)
ギリシャ語 (el)
マレー語 (ms)
チェコ語 (cs)
ルーマニア語 (ro)
デンマーク語 (da)
ハンガリー語 (hu)
タミル語 (ta)
ノルウェー語 (no)
タイ語 (th)
ウルドゥー語 (ur)
クロアチア語 (hr)
ブルガリア語 (bg)
リトアニア語 (lt)
ラテン語 (la)
マオリ語 (mi)
マラヤーラム語 (ml)
ウェールズ語 (cy)
スロバキア語 (sk)
テルグ語 (te)
ペルシャ語 (fa)
ラトビア語 (lv)
ベンガル語 (bn)
セルビア語 (sr)
アゼルバイジャン語 (az)
スロベニア語 (sl)
カンナダ語 (kn)
エストニア語 (et)
マケドニア語 (mk)
ブルトン語 (br)
バスク語 (eu)
アイスランド語 (is)
アルメニア語 (hy)
ネパール語 (ne)
モンゴル語 (mn)
ボスニア語 (bs)
カザフ語 (kk)
アルバニア語 (sq)
スワヒリ語 (sw)
ガリシア語 (gl)
マラーティー語 (mr)
パンジャブ語 (pa)
シンハラ語 (si)
クメール語 (km)
ショナ語 (sn)
ヨルバ語 (yo)
ソマリ語 (so)
アフリカーンス語 (af)
オック語 (oc)
グルジア語 (ka)
ベラルーシ語 (be)
タジク語 (tg)
サンスクリット語 (sd)
グジャラート語 (gu)
アムハラ語 (am)
イディッシュ語 (yi)
ラオス語 (lo)
ウズベク語 (uz)
フェロー語 (fo)
ハイチ語 (ht)
パシュトー語 (ps)
トルクメン語 (tk)
ニーノルウェー語 (nn)
マルタ語 (mt)
サンスクリット語 (sa)
ルクセンブルク語 (lb)
ミャンマー語 (my)
チベット語 (bo)
タガログ語 (tl)
マダガスカル語 (mg)
アッサム語 (as)
タタール語 (tt)
ハワイ語 (haw)
リンガラ語 (ln)
ハウサ語 (ha)
バシキール語 (ba)
ジャワ語 (jw)
スンダ語 (su)

サンプルオーディオ

Librispeech sample 1: サンプル1
Librispeech sample 2: サンプル2

📄 ライセンス

このプロジェクトはApache 2.0ライセンスの下で提供されています。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご