T

Topicclassifier NoURL

WebOrganizerによって開発
ウェブページのテキスト内容に基づいて(URL情報は使用せず)、ウェブコンテンツを17のカテゴリに分類するモデル
ダウンロード数 41.04k
リリース時間 : 2/10/2025

モデル概要

このモデルはgte - base - en - v1.5をベースに微調整されたもので、ウェブページのテキスト内容のトピック分類に特化しており、17のカテゴリをサポートします。

モデル特徴

URL依存なし
ウェブページのテキスト内容のみに依存して分類し、URL情報には依存しません。
多段階トレーニング
Llama - 3.1 - 8BとLlama - 3.1 - 405B - FP8でアノテーションされたデータを使用して2段階のトレーニングを行います。
効率的な推論
デフィルリングとメモリ効率的なアテンション機構をサポートし、実行効率を向上させます。

モデル能力

ウェブページテキスト分類
多カテゴリの確率分布出力

使用事例

コンテンツ管理
ウェブページコンテンツ分類
ウェブページのコンテンツを自動的に分類し、コンテンツの管理と整理を容易にします。
17のカテゴリの確率分布を出力します。
情報フィルタリング
成人向けコンテンツフィルタリング
成人向けコンテンツを識別してフィルタリングします。
成人向けコンテンツのカテゴリを識別できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase