🚀 ウィスパー・ラージv3ドイツ語モデル
このモデルは、OpenAIによって開発された強力な音声認識プラットフォームであるWhisper Large v3をベースに、ドイツ語の音声認識用にファインチューニングされたものです。ドイツ語の音声の処理と認識に特化して最適化されています。
🚀 クイックスタート
このモデルは、ドイツ語の音声認識に特化したWhisper Large v3ベースのモデルです。以下に、使用方法のコード例を示します。
import torch
from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor, pipeline
from datasets import load_dataset
device = "cuda:0" if torch.cuda.is_available() else "cpu"
torch_dtype = torch.float16 if torch.cuda.is_available() else torch.float32
model_id = "primeline/whisper-large-v3-german"
model = AutoModelForSpeechSeq2Seq.from_pretrained(
model_id, torch_dtype=torch_dtype, low_cpu_mem_usage=True, use_safetensors=True
)
model.to(device)
processor = AutoProcessor.from_pretrained(model_id)
pipe = pipeline(
"automatic-speech-recognition",
model=model,
tokenizer=processor.tokenizer,
feature_extractor=processor.feature_extractor,
max_new_tokens=128,
chunk_length_s=30,
batch_size=16,
return_timestamps=True,
torch_dtype=torch_dtype,
device=device,
)
dataset = load_dataset("distil-whisper/librispeech_long", "clean", split="validation")
sample = dataset[0]["audio"]
result = pipe(sample)
print(result["text"])
✨ 主な機能
このモデルは、様々なアプリケーション分野で使用できます。
- ドイツ語の音声を文字起こしする
- 音声コマンドと音声制御
- ドイツ語のビデオの自動字幕付け
- ドイツ語の音声検索クエリ
- ワードプロセッサーの音声入力機能
📦 モデルファミリー
モデル |
パラメータ |
リンク |
Whisper large v3 german |
1.54B |
リンク |
Whisper large v3 turbo german |
809M |
リンク |
Distil-whisper large v3 german |
756M |
リンク |
tiny whisper |
37.8M |
リンク |
📚 ドキュメント
訓練データ
このモデルの訓練データには、様々なソースから収集された大量のドイツ語の音声が含まれています。認識性能を最適化するために、データは慎重に選択され、処理されています。
訓練プロセス
モデルの訓練は、以下のハイパーパラメータを使用して行われました。
- バッチサイズ: 1024
- エポック数: 2
- 学習率: 1e-5
- データ拡張: なし
📄 ライセンス
このモデルは、Apache-2.0ライセンスの下で公開されています。
🔗 関連情報
モデルの詳細
- モデル名: whisper-large-v3-german by Florian Zimmermeister @primeLine
- タスク: 自動音声認識
- データセット: Common Voice de (common_voice_15, de)
- 評価指標:
- Test WER: 3.002 %
- Test CER: 0.81 %
新しいバージョン
primeline/whisper-large-v3-turbo-german
モデルの作成者
Florian Zimmermeister
免責事項
このモデルは、primeLineグループの製品ではありません。
これは、[Florian Zimmermeister](https://huggingface.co/flozi00)による研究成果であり、計算資源はprimeLineによって提供されています。
このモデルは、primeLineによってこのアカウントで公開されていますが、primeLine Solutions GmbHの商用製品ではありません。
私たちは、このモデルを可能な限りテストし、開発していますが、エラーが発生する可能性があることにご留意ください。
このモデルの使用は、自己責任で行ってください。このモデルによって生成された誤った出力について、私たちは責任を負いません。
会社情報
About us

ドイツにおけるAIインフラストラクチャのパートナー
ディープラーニング、機械学習、高性能コンピューティングにおけるあなたの野心を後押しする強力なAIインフラストラクチャを体験してください。
AIの訓練と推論に最適化されています。