L

Llama 3 Typhoon V1.5 8b Audio Preview

由scb10x開發
Typhoon-Audio 預覽版是一款支持泰語和英語的音頻-語言模型,能夠處理文本和音頻輸入,輸出為文本。
下載量 218
發布時間 : 8/10/2024

模型概述

基於Typhoon-1.5-8b-instruct的多模態音頻-語言模型,支持泰語和英語的音頻轉錄、翻譯和問答任務。

模型特點

多模態輸入
原生支持文本和音頻輸入,輸出為文本。
泰語優化
專門針對泰語進行優化,支持泰語音頻轉錄和問答。
高性能
在泰語ASR、翻譯和問答任務中表現優異,超越同類模型。

模型能力

音頻轉錄
文本生成
語音指令理解
多語言翻譯

使用案例

語音轉錄
泰語音頻轉錄
將泰語語音內容轉錄為文本。
WER(詞錯誤率)為14.17
翻譯
英譯泰
將英語語音或文本翻譯為泰語。
BLEU分數為17.52
泰譯英
將泰語語音或文本翻譯為英語。
BLEU分數為24.14
問答
泰語口語問答
回答基於泰語語音的提問。
F1分數為64.60
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase