🚀 w2v-bert-uk v2.1
このモデルは音声自動認識タスクに特化したモデルで、Ukrainian言語に対応しています。Facebookのw2v-bert-2.0をベースに構築され、高い精度で音声を認識することができます。
🚀 クイックスタート
このモデルの概要や使い方、評価指標などの情報をご紹介します。
✨ 主な機能
- 音声自動認識:Ukrainian言語の音声を高精度で認識します。
- コミュニティサポート:DiscordやTelegramでのコミュニティを通じて、モデルに関する情報やサポートを得ることができます。
📦 インストール
以下のコマンドを使用して必要なライブラリをインストールします。
💻 使用例
基本的な使用法
import torch
import soundfile as sf
from transformers import AutoModelForCTC, Wav2Vec2BertProcessor
model_name = 'Yehor/w2v-bert-uk-v2.1'
device = 'cuda:0'
torch_dtype = torch.float16 if torch.cuda.is_available() else torch.float32
sampling_rate = 16_000
asr_model = AutoModelForCTC.from_pretrained(model_name, torch_dtype=torch_dtype).to(device)
processor = Wav2Vec2BertProcessor.from_pretrained(model_name)
paths = [
'sample1.wav',
]
audio_inputs = []
for path in paths:
audio_input, _ = sf.read(path)
audio_inputs.append(audio_input)
inputs = processor(audio_inputs, sampling_rate=sampling_rate).input_features
features = torch.tensor(inputs).half().to(device)
with torch.inference_mode():
logits = asr_model(features).logits
predicted_ids = torch.argmax(logits, dim=-1)
predictions = processor.batch_decode(predicted_ids)
print('Predictions:')
print(predictions)
📚 ドキュメント
コミュニティ
- Discord: https://bit.ly/discord-uds
- 音声認識: https://t.me/speech_recognition_uk
- 音声合成: https://t.me/speech_synthesis_uk
他のUkrainianモデルを見る: https://github.com/egorsmkv/speech-recognition-uk
概要
このモデルは https://huggingface.co/Yehor/w2v-bert-uk の次期モデルです。
評価指標
- AM (F16):
- WER: 0.1734 メトリック, 17.34%
- CER: 0.0333 メトリック, 3.33%
- 単語の正解率: 82.66%
- 文字の正解率: 96.67%
デモ
https://huggingface.co/spaces/Yehor/w2v-bert-uk-v2.1-demo のスペースを使用して、モデルがあなたの音声でどのように動作するかを確認できます。
モデル情報
プロパティ |
詳細 |
ベースモデル |
facebook/w2v-bert-2.0 |
ライブラリ名 |
transformers |
言語 |
uk |
ライセンス |
apache-2.0 |
タスクカテゴリ |
自動音声認識 |
タグ |
audio |
データセット |
Yehor/openstt-uk |
評価指標 |
wer |
モデルインデックス
- 名前: w2v-bert-uk-v2.1
- 結果:
- タスク:
- データセット:
- 名前: common_voice_10_0
- タイプ: common_voice_10_0
- 設定: uk
- 分割: test
- 引数: uk
- 評価指標:
- 名前: WER
- タイプ: wer
- 値: 17.34
- 名前: CER
- タイプ: cer
- 値: 3.33
📄 ライセンス
このモデルは apache-2.0
ライセンスの下で提供されています。
🔧 引用
@misc {smoliakov_2025,
author = { {Smoliakov} },
title = { w2v-bert-uk-v2.1 (Revision 094c59d) },
year = 2025,
url = { https://huggingface.co/Yehor/w2v-bert-uk-v2.1 },
doi = { 10.57967/hf/4554 },
publisher = { Hugging Face }
}