🚀 冰島語文本轉語音模型
這是一個冰島語的文本轉語音模型,它基於 facebook/mms-tts-isl
模型,並使用 Talrómur 數據集進行了微調(詳見 https://repository.clarin.is/repository/xmlui/handle/20.500.12537/330)。該模型能夠將冰島語文本轉換為自然流暢的語音,為冰島語的語音應用提供了強大的支持。
🚀 快速開始
本模型適用於冰島語的文本轉語音應用。以下是使用該模型的基本步驟和示例代碼。
基礎用法
from transformers import VitsModel, AutoTokenizer
import scipy.io.wavfile as wav
import torch
model = VitsModel.from_pretrained("Sigurdur/vits_icelandic_rosa_female_monospeaker")
tokenizer = AutoTokenizer.from_pretrained("Sigurdur/vits_icelandic_rosa_female_monospeaker")
text = "Góðan daginn! Ég heiti Rósa, ég er talgervill"
inputs = tokenizer(text, return_tensors="pt")
with torch.no_grad():
output = model(**inputs).waveform
sampling_rate = getattr(sampling_rate, "sampling_rate", 16000)
if not (0 <= sampling_rate <= 65535):
raise ValueError(f"Invalid sampling rate: {sampling_rate}")
waveform = output.squeeze().cpu().numpy()
保存輸出到文件
wav.write("output.wav", rate=sampling_rate, data=waveform)
在 Jupyter Notebook 中查看
from IPython.display import Audio
Audio(output, rate=sampling_rate)
✨ 主要特性
📚 詳細文檔
模型詳情
這是一個 🤗 Transformers 模型的卡片,該模型已被推送到 Hugging Face Hub,此模型卡片是自動生成的。
用途
本模型專為冰島語的文本轉語音應用而設計。
偏差、風險和侷限性
目前關於模型的偏差、風險和侷限性的信息不足,需要更多的研究和數據來進一步明確。建議用戶(直接用戶和下游用戶)瞭解模型可能存在的風險、偏差和侷限性。
訓練數據
目前關於訓練數據的詳細信息不足,需要更多的研究和數據來進一步明確。
訓練超參數
評估
目前關於模型評估的測試數據、評估因素和評估指標的詳細信息不足,需要更多的研究和數據來進一步明確。
環境影響
可以使用 Lacoste 等人(2019) 提出的 機器學習影響計算器 來估算碳排放。目前關於硬件類型、使用時長、雲服務提供商、計算區域和碳排放的詳細信息不足,需要更多的研究和數據來進一步明確。
技術規格
目前關於模型架構和目標、計算基礎設施(硬件和軟件)的詳細信息不足,需要更多的研究和數據來進一步明確。
引用
目前關於模型引用的 BibTeX 和 APA 信息不足,需要更多的研究和數據來進一步明確。
術語表
目前關於模型相關術語和計算的詳細信息不足,需要更多的研究和數據來進一步明確。
更多信息
目前關於模型的更多詳細信息不足,需要更多的研究和數據來進一步明確。
模型卡片作者
Sigurdur Haukur Birgisson
模型卡片聯繫方式
如需聯繫作者,請通過領英:Sigurdur Haukur Birgisson 。