モデル選定

オープンソースチャットボット

# オープンソースチャットボット

Spydaz Web AI Llava

LLaVaはオープンソースのマルチモーダルチャットボットで、LLaMA/VicunaをGPT生成のマルチモーダル指示追従データでファインチューニングしたもので、チャット/指示に最適化されたマルチモーダル版LLMです。

画像生成テキスト

Transformers 複数言語対応

Table Llava V1.5 7b

Table LLaVA 7Bは、様々な表画像を理解し多様な表関連タスクを遂行するために設計されたオープンソースのマルチモーダルチャットボットです。

画像生成テキスト

Transformers 英語

Llava NeXT Video 7B DPO Hf

LLaVA-NeXT-Videoはオープンソースのマルチモーダルチャットボットで、動画と画像データの混合トレーニングにより最適化され、優れた動画理解能力を備えています。

ビデオ生成テキスト

Transformers 英語

MQT-LLaVAはオープンソースのマルチモーダルチャットボットモデルで、Transformerアーキテクチャに基づき、GPTで生成されたマルチモーダル指令データ上でLLaMA/Vicunaを微調整して訓練されました。

テキスト生成画像

Denseconnector V1.5 8B

DenseConnectorはオープンソースのチャットボットで、LLaMA/Vicunaをファインチューニングし、GPTが生成したマルチモーダル指示追従データでトレーニングされています。

画像生成テキスト

PLLaVAはオープンソースのビデオ言語チャットボットで、ビデオ指令追従データで画像大規模言語モデルを微調整することで得られ、マルチモーダル大規模モデルとチャットボットの研究に使用できます。

テキスト生成ビデオ

Vsft Llava 1.5 7b Hf Trl

LLaVA-1.5-7Bモデルを基に視覚的監督ファインチューニング(VSFT)で訓練されたマルチモーダル視覚言語モデルで、画像理解と対話生成をサポート

画像生成テキスト

Transformers 英語

MGM-7BはVicuna-7B-v1.5をベースに訓練されたオープンソースのマルチモーダルチャットボットで、高精細画像の理解、推論、生成をサポートします。

テキスト生成画像

Llava V1.5 7b Gguf

LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaを微調整し、GPTが生成したマルチモーダル命令追従データに基づいてトレーニングされています。

画像生成テキスト

Llava V1.6 Vicuna 7b

LLaVAはオープンソースのマルチモーダルチャットボットで、マルチモーダル指示追従データを用いた大規模言語モデルのファインチューニングによって訓練されています。

テキスト生成画像

LLaVAはオープンソースのマルチモーダルチャットボットで、大規模言語モデルのファインチューニングにより訓練され、画像とテキストのインタラクションをサポートします。

テキスト生成画像

LLaVa-Phi-2-3Bはオープンソースのマルチモーダルチャットボットモデルで、Phi-2アーキテクチャを基にファインチューニングされ、画像とテキスト入力を処理し自然言語応答を生成できます。

テキスト生成画像

Transformers 英語

ViP-LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaを画像と地域レベルの命令データで微調整してトレーニングされています。

テキスト生成画像

Llama Vid 7b Full 224 Video Fps 1

LLaMA-VIDはLLaMA/Vicunaをファインチューニングしたオープンソースのマルチモーダルチャットボットで、拡張されたコンテキストトークンにより数時間に及ぶ動画処理をサポートします。

テキスト生成ビデオ

Llava V1.5 13b Lora

LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaを微調整し、GPTが生成したマルチモーダル命令追従データに基づいてトレーニングされています。

テキスト生成画像

Llava V1.5 13B AWQ

LLaVAはオープンソースのマルチモーダルチャットボットで、GPTが生成したマルチモーダル命令追従データを用いてLLaMA/Vicunaをファインチューニングしてトレーニングされています。

テキスト生成画像

Llava V1.5 Mlp2x 336px Pretrain Vicuna 13b V1.5

LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/VicunaをGPT生成のマルチモーダル指示追従データでファインチューニングして作成されました。

テキスト生成画像

Llava V1.5 Mlp2x 336px Pretrain Vicuna 7b V1.5

LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaをファインチューニングし、GPTで生成されたマルチモーダル指示追従データでトレーニングされています。

テキスト生成画像

LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaをファインチューニングし、画像とテキストのインタラクションをサポートします。

画像生成テキスト

Llava Pretrain Vicuna 7b V1.3

LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaを基にGPTが生成したマルチモーダル指示追従データでファインチューニングされています。

テキスト生成画像

Llava Llama 2 7b Chat Lightning Lora Preview

LLaVAはオープンソースのマルチモーダルチャットボットで、LLaMA/Vicunaをファインチューニングし、GPTで生成されたマルチモーダル指示追従データでトレーニングされています。

テキスト生成画像

Stable Vicuna 13B GPTQ

StableVicuna-13BはVicuna-13B v0モデルをベースに、RLHFで微調整された対話モデルで、4ビットGPTQ量子化形式を採用しています。

大規模言語モデル

Transformers 英語

VicunaはLLaMAをベースに微調整されたオープンソースのチャットボットで、ユーザーが共有した対話データを使って訓練され、学術研究に適しています。

大規模言語モデル

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase