M

Mistral Speech To Text

由 0-hero 开发
这是一个实验性模型,通过将音频波形转换为ASCII艺术,然后微调Mistral模型来预测文本。
下载量 20
发布时间 : 4/4/2024

模型简介

该模型尝试通过音频波形的ASCII艺术表示来进行语音到文本的转换,是一个概念验证项目。

模型特点

创新的ASCII艺术输入
将音频波形转换为ASCII艺术作为模型输入,探索非传统语音识别方法
基于Mistral微调
利用强大的Mistral 7B模型作为基础进行微调
实验性方法
展示了一种新颖但尚不成熟的语音识别思路

模型能力

音频波形分析
ASCII艺术理解
文本预测

使用案例

语音识别研究
语音识别替代方法探索
探索不依赖传统频谱分析的语音识别方法
目前效果有限,ROUGE-1 F1分数约0.11
教育演示
机器学习创新方法教学
展示非传统输入表示在NLP中的应用
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase