モデル選定

軽量音声モデル

# 軽量音声モデル

YarnGPT2はナイジェリアアクセントの言語（ヨルバ語、イボ語、ハウサ語及び英語）を合成するために特別に設計されたテキスト読み上げ（TTS）モデルです。

Transformers 英語

Wav2vec2 Base BirdSet XCL

wav2vec 2.0 は音声表現学習のための自己教師あり学習フレームワークで、ラベル付けされていない音声データから音声特徴を学習できます。

DBD-research-group

Parler-TTS Mini v0.1は軽量のテキスト音声変換モデルで、10.5K時間の音声データを基に訓練され、高品質で自然な流れの良い音声を生成でき、簡単なテキストプロンプトで音声の特徴を制御できます。

Transformers 英語

Mms Spa Finetuned Colombian Monospeaker

これはMMSベースのスペイン語TTSモデルで、VITSアーキテクチャを使用してファインチューニングされており、わずか80-150のサンプルと20分のトレーニング時間でコロンビアアクセントのスペイン語音声を生成できます。

Transformers スペイン語

Distilhubert Finetuned Gtzan

DistilHuBERTをGTZAN音楽分類データセットでファインチューニングした軽量音響特徴抽出モデル

Distilhubert Finetuned Gtzan

このモデルはGTZAN音楽分類データセットで微調整されたDistilHuBERTベースの音声分類モデルで、精度は88%です

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase