L

Llama3.1 Typhoon2 Audio 8b Instruct

由scb10x開發
颱風2-音頻版是一個端到端的語音轉語音模型架構,能夠處理音頻、語音和文本輸入,並同時生成文本和語音輸出。該模型專門針對泰語優化,同時也支持英語。
下載量 664
發布時間 : 12/13/2024

模型概述

基於颱風2大語言模型的語音轉語音模型,支持泰語和英語的語音輸入與輸出,具備文本生成和語音合成能力。

模型特點

多模態輸入輸出
支持音頻、語音和文本輸入,並能同時生成文本和語音輸出
泰語優化
專門針對泰語進行優化,提供高質量的泰語語音處理能力
端到端架構
完整的語音轉語音處理流程,無需額外中間處理步驟
多輪對話支持
支持複雜的多輪對話交互,保持上下文一致性

模型能力

語音識別
語音合成
文本生成
語音轉語音
多語言處理
對話系統

使用案例

語音助手
泰語語音助手
構建泰語語音助手,支持語音輸入和語音輸出
在泰語語音質量評估中獲得7.19分(滿分10分)
語音轉錄
泰語語音轉錄
將泰語語音內容轉錄為文本
泰語ASR的WER為14.04%
語音翻譯
英泰語音翻譯
將英語語音翻譯為泰語文本或語音
英譯泰BLEU得分為27.15
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase