Waynehills-STT-doogie-serverオープンソース音声認識モデル - 音声内容を正確かつ効率的に認識

ホーム

Waynehills STT Doogie Server

Waynehillsdevによって開発

Doogie/Waynehills-STT-doogie-serverをファインチューニングした音声認識モデル

音声認識

Transformers

オープンソースライセンス:Apache-2.0 #音声からテキストへ #低遅延処理 #高精度認識

ダウンロード数 28

リリース時間 : 3/2/2022

モデル概要

このモデルは音声認識(STT)モデルで、主に音声をテキストに変換するために使用されます。Doogie/Waynehills-STT-doogie-serverを未知のデータセットでファインチューニングしています。

モデル特徴

ファインチューニング最適化

元のモデルを基にファインチューニングを行い、特定の分野やシーン向けに最適化されている可能性があります

Apache 2.0ライセンス

Apache 2.0オープンソースライセンスを採用しており、商用利用が可能です

モデル能力

音声からテキストへ

自動音声認識

使用事例

音声文字起こし

会議議事録

会議の録音を自動的に文字記録に変換

音声アシスタント

音声アシスタントに音声認識機能を提供

プロパティ	詳細
モデルタイプ	不明なデータセットでファインチューニングされた Doogie/Waynehills-STT-doogie-server のバージョン
トレーニングデータ	不明

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Waynehills STT Doogie Server

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Waynehills-STT-doogie-server

📚 ドキュメント

トレーニング手順

トレーニングハイパーパラメータ

フレームワークバージョン

📄 ライセンス