I

Internlm Xcomposer2d5 7b

internlmによって開発
InternLM-XComposer2.5は卓越した画像テキスト理解と創作モデルで、わずか70億パラメータでGPT-4Vレベルの能力を達成し、長文脈ウィンドウの拡張をサポートします。
ダウンロード数 1,501
リリース時間 : 7/2/2024

モデル概要

このモデルは2.4万枚のインターレース画像テキストコンテキストで訓練され、RoPE外挿技術により9.6万の長文脈ウィンドウに拡張可能で、大量の入出力コンテキストを必要とするシナリオで特に優れた性能を発揮します。

モデル特徴

強力な画像テキスト理解能力
わずか70億パラメータでGPT-4Vレベルの画像テキスト理解能力を達成
長文脈処理
RoPE外挿技術により9.6万の長文脈ウィンドウに拡張可能
マルチモーダルサポート
画像、動画など様々なメディアフォーマットの理解と分析をサポート
ウェブページ生成能力
指示、履歴書やスクリーンショットに基づいて完全なウェブページコードを生成

モデル能力

動画コンテンツ理解
複数画像を用いたマルチターン対話
高精細画像解析
指示によるウェブページ生成
履歴書からウェブページ変換
スクリーンショットからウェブページ変換

使用事例

コンテンツ理解
動画コンテンツ分析
動画フレームを分析し、動画内容を詳細に記述
動画中の選手、試合シーンや重要な詳細を正確に識別可能
複数画像比較分析
複数の画像を比較分析し、アドバイスを提供
異なる車両の優劣を詳細に分析し、購入アドバイスを提供可能
ウェブページ生成
指示によるウェブページ生成
自然言語の指示に基づき完全なウェブページコードを生成
要求に合致する研究機関公式サイトのHTMLコードを生成
履歴書からウェブページ変換
Markdown形式の履歴書を個人ウェブページに変換
美しい個人履歴書ウェブページを生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase