V

Voxtral Mini 3B 2507 Transformers

MohamedRashadによって開発
Voxtral MiniはMinistral 3Bをベースにした拡張版で、高度な音声入力機能を備え、音声文字起こし、翻訳、音声理解などの分野で優れた性能を発揮します。
ダウンロード数 416
リリース時間 : 7/18/2025

モデル概要

Voxtral Miniはテキストと音声処理能力を結合したマルチモーダルモデルで、Ministral 3Bのテキスト処理能力を維持しながら、強力な音声理解機能を追加しています。

モデル特徴

専用文字起こしモード
純粋な音声文字起こしモードで動作し、ソース音声の言語を自動認識してテキストに文字起こしします。
長文脈処理
32kトークンのコンテキスト長をサポートし、30 - 40分の音声を処理できます。
組み込み質問応答と要約機能
音声で直接質問し、構造化された要約を生成することができ、個別のASRと言語モデルは必要ありません。
ネイティブ多言語サポート
8つの主要言語の音声処理を自動検出してサポートします。
音声直接呼び出し機能
音声の意図に基づいてバックエンド機能、ワークフロー、またはAPI呼び出しを直接トリガーすることができます。

モデル能力

音声文字起こし
音声理解
多言語サポート
長音声処理
テキスト生成
質問応答システム
要約生成
複数回の対話

使用事例

音声処理
会議記録の文字起こし
30分の会議録音を自動的に文字起こしします。
高い精度の文字起こしテキスト
多言語音声翻訳
ある言語の音声をリアルタイムで別の言語のテキストに翻訳します。
8つの主要言語の相互翻訳をサポート
音声分析
音声内容理解
音声内容に直接質問して回答を取得します。
文字起こしせずに音声内容を理解できます。
音声要約生成
長い音声を分析して構造化された要約を生成します。
手作業で整理する時間を節約します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase