P

Phi 4 Mm Inst Asr Singlish

mjwongによって開発
シンガポール英語に最適化されたマルチモーダル音声認識モデルで、マイクロソフトのPhi-4マルチモーダル命令モデルをファインチューニングし、シンガポール英語の独特な音声特徴の認識能力を大幅に向上させました。
ダウンロード数 61
リリース時間 : 5/1/2025

モデル概要

このモデルは、汎用大規模言語モデルが地域方言を十分に表現できない問題を解決することを目的としており、特にシンガポール英語(Singlish)のコードスイッチングと独特な韻律に最適化され、'聞く-理解する-自然に応答する'という統一モデルのビジョンを実現します。

モデル特徴

シンガポール英語最適化
シンガポール英語のコードスイッチングと独特な韻律特徴に特化して最適化され、認識精度が大幅に向上しました。
マルチモーダル能力
Phi-4マルチモーダル命令モデルをベースとしており、音声とテキストのマルチモーダル処理能力を備えています。
効率的なファインチューニング
音声関連モジュールのみを解凍してトレーニングを行うことで、コアの言語理解能力を維持しながらシンガポール英語に効率的に適応します。
インテリジェントな終了
終了マーカーのトレーニングにより、モデルは転写の終了点を正確に判断し、冗長な出力を回避できます。

モデル能力

シンガポール英語音声認識
マルチモーダル理解
音声転写
音声優先エージェント開発

使用事例

音声転写
シンガポール英語会話転写
シンガポール英語の特徴を含む日常会話をテキストに転写
単語誤り率(WER)は13.16%まで低減
インテリジェントアシスタント
シンガポール英語音声アシスタント
シンガポール英語のアクセントを理解できる音声優先インテリジェントアシスタントの開発
'聞く-理解する-自然に応答する'という統一モデルを実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase