F

Fireredasr AED L

FireRedTeamによって開発
FireRedASRは、標準中国語、中国語方言、英語をサポートするオープンソースの産業用自動音声認識(ASR)モデルシリーズです。公開されている標準中国語ASRベンチマークテストで最新最優(SOTA)レベルを達成し、優れた歌詞認識能力も備えています。
ダウンロード数 216
リリース時間 : 1/24/2025

モデル概要

FireRedASRは、優れた性能と最高の効率に対するさまざまなアプリケーションシナリオの多様なニーズを満たすために、2種類のバリアントを設計しています:FireRedASR-LLMとFireRedASR-AED。前者はエンコーダー-アダプター-大規模言語モデルフレームワークを採用し、SOTA性能を実現し、エンドツーエンドの音声インタラクションをサポートすることを目的としています。後者は注意メカニズムに基づくエンコーダー-デコーダーアーキテクチャを採用し、高性能と計算効率のバランスを取り、LLMベースの音声モデルにおける効率的な音声表現モジュールとして機能します。

モデル特徴

多言語サポート
標準中国語、中国語方言、英語の自動音声認識をサポート
産業用性能
公開標準中国語ASRベンチマークテストでSOTAレベルを達成
優れた歌詞認識能力
優れた歌詞認識性能を備えています
2つのアーキテクチャ選択
LLMとAEDの2つのアーキテクチャを提供し、さまざまなシナリオのニーズを満たします

モデル能力

標準中国語音声認識
中国語方言音声認識
英語音声認識
歌詞認識

使用事例

音声からテキストへ
会議議事録
会議の録音をテキスト記録に変換
ws_meetingデータセットでCERが4.67%
音声アシスタント
インテリジェント音声アシスタントの音声認識モジュールとして使用
マルチメディア処理
字幕生成
ビデオコンテンツに自動的に字幕を生成
歌詞認識
音楽から歌詞を認識
優れた歌詞認識能力を備えています
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase