孟子オスカーベースキャプションオープンソースモデル - 画像に対して正確な中国語の説明内容を生成する

ホーム

Mengzi Oscar Base Caption

Langboatによって開発

中国語マルチモーダル事前学習モデル孟子-オスカーを基に、AIC-ICC中国語画像キャプションデータセットでファインチューニングされた中国語マルチモーダル画像キャプションモデル

画像生成テキスト

Transformers

中国語オープンソースライセンス:Apache-2.0 #中国語マルチモーダル #画像キャプション生成 #軽量事前学習

ダウンロード数 23

リリース時間 : 3/2/2022

モデル概要

このモデルは中国語向けのマルチモーダル画像キャプションモデルで、入力された画像に対応する中国語の説明テキストを生成できます。

モデル特徴

中国語マルチモーダル能力

中国語シーンに特化して最適化された画像理解とキャプション生成能力

軽量設計

孟子軽量事前学習モデルアーキテクチャを基に、リソース要求が比較的低い

専門的なファインチューニング

AIC-ICC中国語画像キャプションデータセットでターゲットを絞ったファインチューニングを実施

モデル能力

画像理解

中国語テキスト生成

マルチモーダル特徴抽出

使用事例

コンテンツ生成

自動画像タグ付け

ECプラットフォームの商品画像に自動的に説明文を生成

商品情報入力効率の向上

アクセシビリティ支援

視覚障害者向けに画像内容の音声説明を提供

情報取得の利便性向上

メディア分析

ソーシャルメディアコンテンツ分析

ソーシャルメディアの画像内容を自動分析・説明

コンテンツ審査と分類の支援

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Mengzi Oscar Base Caption

モデル概要

モデル特徴

モデル能力

使用事例

🚀 萌子-oscar-base-caption (中国語のマルチモーダル画像キャプションモデル)

🚀 クイックスタート

インストール

事前学習とファインチューニング

📄 ライセンス

📚 引用