hamsa-v0.1-betaオープンソースアラビア語音声認識モデル - 中東と北アフリカの言語ニーズを満たす

ホーム

Hamsa V0.1 Beta

nadsoftによって開発

HamsaはWhisperモデルを基に構築されたアラビア語音声認識モデルで、中東および北アフリカ地域の言語ニーズに焦点を当てています。

音声認識

Transformers

アラビア語オープンソースライセンス:Apache-2.0 #アラビア語音声認識 #Whisperアーキテクチャ最適化 #MENA地域適応

ダウンロード数 46

リリース時間 : 10/20/2023

モデル概要

Hamsa（همسة）は事前トレーニング済みのアラビア語自動音声認識（ASR）モデルで、アラビア語特有の言語的微妙な差異に対処し、特に中東および北アフリカ地域での使用に適しています。

モデル特徴

アラビア語最適化

アラビア語に特化して最適化され、中東および北アフリカ地域特有の言語的微妙な差異に対処します。

多様なデータソースでのトレーニング

nadsoft/Jordan-Audio、google/fleurs、common_voice_11_0など、複数のアラビア語音声データセットを組み合わせてトレーニングされています。

先進的な技術

Whisperモデルアーキテクチャを採用し、Adamオプティマイザーや混合精度トレーニングなどの先進技術を使用しています。

モデル能力

アラビア語音声認識

標準アラビア語文字起こし

音声からテキストへの変換

使用事例

音声文字起こし

標準アラビア語文字起こし

標準アラビア語音声をテキストに変換

単語誤り率（WER）は18.22

教育

アラビア語学習支援

学習者がアラビア語の発音と文字起こしを練習するのを支援

🚀 Hamsa-v0.1-beta

Hamsaは、アラビア語の音声認識分野における高度な進歩を表しています。この事前学習された自動音声認識（ASR）モデルは、Whisperモデルをベースに構築されており、NADSOFTがアラビア語のAI成果の基準を引き上げる取り組みを象徴しています。この貢献は、中東・北アフリカ（MENA）地域や広いアラブ世界にとって特に重要で、これらの地域の固有の言語的ニュアンスに対応し、特定のニーズに応えることを目指しています。

🚀 クイックスタート

このドキュメントでは、Hamsa-v0.1-betaモデルの詳細な情報を提供します。このモデルはアラビア語の音声認識に特化しており、その特徴、使用目的、制限事項、トレーニングデータ、トレーニング手順などについて説明します。

✨ 主な機能

アラビア語の自動音声認識を行うことができます。
Whisperモデルをベースに構築されており、高度な音声認識能力を備えています。
中東・北アフリカ地域やアラブ世界の言語的ニュアンスに対応しています。

📚 ドキュメント

モデルの説明

Hamsa (همسة) は、アラビア語の音声認識の分野における高度な進歩を表しています。これは、Whisperモデルをベースに構築された事前学習済みの自動音声認識（ASR）モデルです。Hamsaは単なる技術的な成果物ではなく、NADSOFTがアラビア語のAI成果の基準を引き上げる取り組みの証です。この貢献は、中東・北アフリカ（MENA）地域や広いアラブ世界にとって特に重要で、これらの地域の固有の言語的ニュアンスに対応し、特定のニーズに応えることを目指しています。