L

Llama 3 Typhoon V1.5 8b Audio Preview

由 scb10x 开发
Typhoon-Audio 预览版是一款支持泰语和英语的音频-语言模型,能够处理文本和音频输入,输出为文本。
下载量 218
发布时间 : 8/10/2024

模型简介

基于Typhoon-1.5-8b-instruct的多模态音频-语言模型,支持泰语和英语的音频转录、翻译和问答任务。

模型特点

多模态输入
原生支持文本和音频输入,输出为文本。
泰语优化
专门针对泰语进行优化,支持泰语音频转录和问答。
高性能
在泰语ASR、翻译和问答任务中表现优异,超越同类模型。

模型能力

音频转录
文本生成
语音指令理解
多语言翻译

使用案例

语音转录
泰语音频转录
将泰语语音内容转录为文本。
WER(词错误率)为14.17
翻译
英译泰
将英语语音或文本翻译为泰语。
BLEU分数为17.52
泰译英
将泰语语音或文本翻译为英语。
BLEU分数为24.14
问答
泰语口语问答
回答基于泰语语音的提问。
F1分数为64.60
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase