P

Pathumma Llm Audio 1.0.0

由 nectec 开发
Pathumma-llm-audio-1.0.0是一个80亿参数的泰语大语言模型,专为音频理解任务设计,能够处理语音、通用音频和音乐等多种音频输入。
下载量 333
发布时间 : 10/24/2024

模型简介

该模型结合了OpenThaiLLM-DoodNiLT-V1.0.0-Beta-7B语言模型和Pathumma-whisper-th-large-v3语音编码器,能够将音频转换为有意义的文本表示。

模型特点

多类型音频处理
能够处理语音、通用音频和音乐等多种类型的音频输入。
泰语优化
专为泰语设计,优化了泰语语音和文本的转换能力。
高效推理
支持LoRA推理模式,适合在有限资源下运行。

模型能力

音频转录
语音理解
文本生成

使用案例

语音转录
泰语语音转文本
将泰语语音转换为文本输出。
音频理解
通用音频分析
分析通用音频内容并生成描述性文本。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase