L

Llama 3 Typhoon V1.5 8b Audio Preview

Developed by scb10x
Typhoon-Audio 預覽版是一款支持泰語和英語的音頻-語言模型,能夠處理文本和音頻輸入,輸出為文本。
Downloads 218
Release Time : 8/10/2024

Model Overview

基於Typhoon-1.5-8b-instruct的多模態音頻-語言模型,支持泰語和英語的音頻轉錄、翻譯和問答任務。

Model Features

多模態輸入
原生支持文本和音頻輸入,輸出為文本。
泰語優化
專門針對泰語進行優化,支持泰語音頻轉錄和問答。
高性能
在泰語ASR、翻譯和問答任務中表現優異,超越同類模型。

Model Capabilities

音頻轉錄
文本生成
語音指令理解
多語言翻譯

Use Cases

語音轉錄
泰語音頻轉錄
將泰語語音內容轉錄為文本。
WER(詞錯誤率)為14.17
翻譯
英譯泰
將英語語音或文本翻譯為泰語。
BLEU分數為17.52
泰譯英
將泰語語音或文本翻譯為英語。
BLEU分數為24.14
問答
泰語口語問答
回答基於泰語語音的提問。
F1分數為64.60
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase