# ワンショット学習

Kotoba Speech V0.1
Apache-2.0
Kotoba-Speech v0.1 は12億パラメータのTransformerベースの日本語音声生成モデルで、テキスト読み上げとワンショット音声クローニングをサポートしています。
音声合成 Transformers 日本語
K
kotoba-tech
23
16
Deplot
Apache-2.0
DePlotは視覚言語推論モデルで、グラフ画像を線形化された表に変換し、大規模言語モデルと組み合わせて少数サンプル推論を実現
画像生成テキスト Transformers 複数言語対応
D
google
13.72k
298
Test1 1 1 1
Openrail
ukeebaがTheLastBenのfast-DreamBoothノートブックを使用してトレーニングしたDreamboothモデルで、テキストから画像を生成するタスクに適しています。
画像生成
T
ukeeba
17
0
Clipseg Rd16
Apache-2.0
CLIPベースのゼロショットおよびワンショット画像セグメンテーションモデル、テキストと画像プロンプトをサポート
画像セグメンテーション Transformers
C
CIDAS
5,256
0
Clipseg Rd64
Apache-2.0
CLIPSegはテキストと画像プロンプトに基づく画像セグメンテーションモデルで、ゼロショットおよびワンショット画像セグメンテーションタスクをサポートします。
画像セグメンテーション Transformers
C
CIDAS
62
3
Clipseg Rd64 Refined
Apache-2.0
CLIPSegはテキストと画像プロンプトに基づく画像セグメンテーションモデルで、ゼロショットおよびワンショット画像セグメンテーションタスクをサポートします。
画像セグメンテーション Transformers
C
CIDAS
10.0M
122
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase