whisper-small-ko-low-qual-voiceオープンソース韓国語音声認識モデル

ホーム

Whisper Small Ko Low Qual Voice

kimthegardenによって開発

Whisper-smallアーキテクチャをベースに微調整された韓国語自動音声認識モデルで、韓国語音声認識タスクで優れた性能を発揮します。

音声認識

Safetensors

韓国語オープンソースライセンス:MIT #韓国語音声認識 #高精度な文字起こし #オフラインバッチ処理

ダウンロード数 211

リリース時間 : 7/2/2025

モデル概要

このモデルはWhisper-smallアーキテクチャをベースに微調整された韓国語自動音声認識モデルで、会話、ラジオ、ニュースなどの様々な韓国語音声処理シーンに適用できます。

モデル特徴

高精度な認識

韓国語音声認識タスクで優れた性能を発揮し、韓国語音声の内容を正確に文字起こしできます。

多様なシーンでの利用可能

オフラインまたはバッチでの韓国語音声データの文字起こしに使用でき、韓国語音声アシスタントシステムにも統合できます。

拡張性が高い

法律、医療、教育などの特定分野のデータセットでさらに微調整することができます。

モデル能力

韓国語音声認識

音声文字起こし

音声アシスタントへの統合

使用事例

音声文字起こし

オフライン音声文字起こし

韓国語音声データのバッチ文字起こしに使用します。

音声アシスタントへの統合

韓国語音声アシスタントシステムに統合します。

分野特定のアプリケーション

法律分野

法律分野のデータセットでさらに微調整し、法律音声の文字起こしに使用します。

医療分野

医療分野のデータセットでさらに微調整し、医療音声の文字起こしに使用します。

🚀 whisper-small-ko-finetunedのモデルカード

このモデルは、SungBeom/whisper-small-ko モデルを、カスタムの韓国語音声認識データセットでファインチューニングしたバージョンです。
韓国語の音声データに対する自動音声認識（ASR）を行い、検証セットで高い性能を発揮します。

🚀 クイックスタート

from transformers import WhisperProcessor, WhisperForConditionalGeneration
import torch

model = WhisperForConditionalGeneration.from_pretrained("your-username/whisper-small-ko-finetuned")
processor = WhisperProcessor.from_pretrained("your-username/whisper-small-ko-finetuned")

# Input: 16kHz waveform (float32 numpy or tensor)
inputs = processor(audio_waveform, sampling_rate=16000, return_tensors="pt")

with torch.no_grad():
    predicted_ids = model.generate(inputs.input_features)

transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)
print(transcription[0])

✨ 主な機能

韓国語の自動音声認識（ASR）
韓国語音声データのオフラインまたはバッチ文字起こし
韓国語の音声アシスタントシステムへの統合
特定ドメインのデータセットでのさらなるファインチューニング
韓国語ASRモデルの頑健性や多言語Whisperモデルに関する研究

📚 ドキュメント

モデルの詳細

モデルの説明

このモデルは、Whisper-smallアーキテクチャに基づいており、Hugging Face TransformersとPyTorchを使用して、62,327の韓国語音声と文字起こしのペアでファインチューニングされています。
一般ドメインの韓国語音声認識（会話、放送、ニュースなど）を目的として設計されています。

属性	详情
開発者	[Jeongwon Kim]
共有者	[kimthegarden]
モデルタイプ	エンコーダ-デコーダTransformer (WhisperForConditionalGeneration)
言語	韓国語 (`ko`)
ライセンス	MIT
ファインチューニング元のモデル	`SungBeom/whisper-small-ko`