低延遲語音生成

# 低延遲語音生成

Kimi-Audio是一款開源的音頻基礎模型，在音頻理解、生成和對話方面表現卓越。

語音識別支持多種語言

Orpheus 3b 0.1 GGUF

基於Llama架構的語音大模型，專為高質量文本轉語音設計，支持情感控制和即時流式傳輸

語音合成支持多種語言

GLaDOS是一個文本轉語音(TTS)模型，基於NVIDIA的NeMo和RIVA框架構建，能夠生成高質量的語音輸出。

語音合成英語

Seamless M4t V2 Large

SeamlessM4T v2 是 Facebook 發佈的大規模多語言多模態機器翻譯模型，支持近100種語言的語音和文本翻譯。

文本生成音頻

Transformers 支持多種語言

Mms Spa Finetuned Chilean Monospeaker

基於Facebook MMS-TTS西班牙語版的輕量級文本轉語音模型，專門針對智利西班牙語口音進行微調

Transformers 西班牙語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase