M

Mistral Speech To Text

Developed by 0-hero
これは実験的なモデルで、オーディオ波形をASCIIアートに変換し、Mistralモデルを微調整してテキストを予測します。
Downloads 20
Release Time : 4/4/2024

Model Overview

このモデルは、オーディオ波形のASCIIアート表現を通じて音声からテキストへの変換を試みる、概念実証プロジェクトです。

Model Features

革新的なASCIIアート入力
オーディオ波形をASCIIアートに変換してモデル入力とし、非伝統的な音声認識方法を探求
Mistralベースの微調整
強力なMistral 7Bモデルを基盤として微調整を実施
実験的手法
斬新だが未成熟な音声認識のアプローチを提示

Model Capabilities

オーディオ波形分析
ASCIIアート理解
テキスト予測

Use Cases

音声認識研究
音声認識代替手法の探求
伝統的なスペクトル分析に依存しない音声認識方法の探索
現時点での効果は限定的、ROUGE-1 F1スコア約0.11
教育デモ
機械学習の革新的手法教育
NLPにおける非伝統的入力表現の応用例を展示
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase