wav2vec2 - vd鸟类声音分类モデルのオープンソース化 - インド保护区の21种の鸟类を无料で识别

ホーム

Wav2vec2 Vd Bird Sound Classification

greenarcadeによって開発

wav2vec2-baseでトレーニングされた鳥類音声分類モデル。インドのVedanthangal鳥類保護区の21種の鳥類を識別可能

音声分類

Transformers

英語オープンソースライセンス:MIT #鳥類音声識別 #高精度オーディオ分類 #生態保護アプリケーション

ダウンロード数 133

リリース時間 : 4/7/2025

モデル概要

このモデルはオーディオ分類モデルで、録音音声から特定の鳥類種を識別するために特別に設計されています。カスタムデータセットでトレーニングされており、生態研究や鳥類保護アプリケーションに適しています。

モデル特徴

高精度

カスタム鳥類データセットで91.11%の精度と89.41のF1スコアを達成

高速推論

平均推論速度0.476秒

特定地域カバレッジ

Vedanthangal鳥類保護区の21種の在来鳥類に特化

モデル能力

鳥類音声識別

オーディオ分類

生態モニタリング

使用事例

生態研究

鳥類個体群モニタリング

オーディオ記録を通じて特定地域の鳥類種分布を自動識別

生態学者が鳥類個体群の変化を追跡するのに役立つ

自然保護

保護区管理

保護区内の特定鳥類の活動状況を自動監視

保護区管理の意思決定にデータを提供

🚀 greenarcade/wav2vec2-vd-bird-sound-classification

独自のカスタムデータセットで学習された鳥の鳴き声分類モデルです。音声録音から地域の鳥の種類を識別します。

🚀 クイックスタート

このモデルは、音声録音から鳥の種類を識別するために使用できます。以下のコード例を参照してください。

💻 使用例

基本的な使用法

from transformers import pipeline

classifier = pipeline("audio-classification", "greenarcade/wav2vec2-vd-bird-sound-classification")
result = classifier("your_audio.wav", top_k=3)

📚 ドキュメント

モデル情報

属性	详情
開発者	Suvan GS ＆ [Dharanya T]
モデルタイプ	Transformers
ライセンス	MIT
リポジトリ	Minor Project
デモ	Space

モデルの使用目的

このモデルは、Vedanthangal鳥類保護区で観察された21種の鳥の鳴き声を分類するために使用されます。

適用範囲外の使用

このモデルは、以下にリストされていない鳥の種類には機能しません。

鳥の一般名
アジアハシバシコウノトリ
アオビハチクイ
カワセミ
ユーラシアヘラサギ
チャボガモ
コガモ
ハコチョウ
キンヨウナギ
オオサギ
アオサギ
ホシミサギ
ハジロガモ
コサギ
マガモ
ハジロハシガモ
ミヤマコウノトリ
ハナミツバト
オオハシワシ
モミジフクロウ
シロハシチョウ
ミヤマカワセミ