asr-voxrex-bart-baseオープンソースモデル - 無料で音声を高精度にテキストに変換

ホーム

Asr Voxrex Bart Base

KBLabによって開発

これはシーケンスツーシーケンスアーキテクチャに基づく自動音声認識モデルで、音声をテキストに変換することができます。

音声認識

Transformers

#エンドツーエンドの音声からテキストへの変換 #多言語音声認識 #リアルタイム音声文字起こし

ダウンロード数 28

リリース時間 : 3/2/2022

モデル概要

このモデルは主に音声信号を対応するテキスト内容に変換するために使用され、さまざまな音声認識シーンに適しています。

モデル特徴

効率的な音声からテキストへの変換

音声信号を迅速かつ正確にテキスト内容に変換することができます。

シーケンスツーシーケンスアーキテクチャ

先進的なシーケンスツーシーケンスモデルアーキテクチャを採用し、認識精度を向上させます。

多言語サポート

複数の言語の音声認識をサポートします（具体的な言語は明確に説明されていません）。

モデル能力

音声からテキストへの変換

リアルタイム音声認識

バッチ音声処理

使用事例

音声文字起こし

会議記録

会議録音を自動的に文字記録に変換します

会議記録の効率を向上させ、人手による文字起こし時間を削減します

音声アシスタント

音声アシスタントに音声認識機能を提供します

自然言語対話機能を実現します

字幕生成

動画字幕

動画内容に自動的に字幕を生成します

動画のアクセシビリティを向上させ、字幕制作時間を節約します

属性	详情
タグ	自動音声認識、トレーナーから生成、音声認識シーケンス対シーケンス

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Asr Voxrex Bart Base

モデル概要

モデル特徴

モデル能力

使用事例

🚀 自動音声認識

📚 ドキュメント

タグ情報

テスト