H

Hamsa V0.1 Beta

nadsoftによって開発
HamsaはWhisperモデルを基に構築されたアラビア語音声認識モデルで、中東および北アフリカ地域の言語ニーズに焦点を当てています。
ダウンロード数 46
リリース時間 : 10/20/2023

モデル概要

Hamsa(همسة)は事前トレーニング済みのアラビア語自動音声認識(ASR)モデルで、アラビア語特有の言語的微妙な差異に対処し、特に中東および北アフリカ地域での使用に適しています。

モデル特徴

アラビア語最適化
アラビア語に特化して最適化され、中東および北アフリカ地域特有の言語的微妙な差異に対処します。
多様なデータソースでのトレーニング
nadsoft/Jordan-Audio、google/fleurs、common_voice_11_0など、複数のアラビア語音声データセットを組み合わせてトレーニングされています。
先進的な技術
Whisperモデルアーキテクチャを採用し、Adamオプティマイザーや混合精度トレーニングなどの先進技術を使用しています。

モデル能力

アラビア語音声認識
標準アラビア語文字起こし
音声からテキストへの変換

使用事例

音声文字起こし
標準アラビア語文字起こし
標準アラビア語音声をテキストに変換
単語誤り率(WER)は18.22
教育
アラビア語学習支援
学習者がアラビア語の発音と文字起こしを練習するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase