Tarot_Question_Detectorオープンソースモデル - テキストがタロット占いの質問かどうかを正確に検出

ホーム

Tarot Question Detector

AlexTANG-JXによって開発

DistilBERTベースのテキスト分類モデルで、入力テキストがタロット占いに適した問題かどうかを検出します。

テキスト分類

Safetensors

英語#タロット問題識別 #軽量BERT #英語テキスト分類

ダウンロード数 33

リリース時間 : 3/13/2025

モデル概要

このモデルはDistilBERTアーキテクチャに基づいており、入力テキストがタロット占い問題の特徴に合致するかどうかを判断するために特別に設計されています。占いアプリケーションの問題選別シナリオに適しています。

モデル特徴

軽量モデル

DistilBERTアーキテクチャを採用し、標準BERTモデルよりも小型で高速ながら、高い精度を維持します。

専門的な最適化

タロット占い類の問題のテキスト特徴に特化してトレーニングと最適化が行われています。

簡単で使いやすい

直接的な推論スクリプトとAPI展開ソリューションを提供し、様々なアプリケーションへの統合が容易です。

モデル能力

テキスト分類

問題検出

占い問題識別

使用事例

占いアプリケーション

占い問題の選別

タロット占いアプリで有効な問題テキストを自動的に選別します

占い要件に合致する問題を正確に識別

ユーザー入力検証

ユーザー入力が占い問題の形式要件に合致しているかを検証します

占いシステムの入力品質向上

🚀 DistilBERT 占い質問検出モデル

本プロジェクトでは、DistilBERT ベースの占い質問検出モデルを提供しています。このモデルは、入力されたテキストがタロット占いに適した質問かどうかを判断することができます。

📂 ディレクトリ構造

model.safetensors: 学習済みのモデルの重みです。
config.json: モデルアーキテクチャの設定ファイルです。
tokenizer.json: トークナイザーの設定です。
special_tokens_map.json: 特殊トークンの設定です。
vocab.txt: トークナイザーの語彙ファイルです。

🚀 クイックスタート

1️⃣ 依存関係のインストール

Python 3.8 以上がインストールされた環境で、以下のコマンドを実行して必要な依存ライブラリをインストールしてください。

pip install torch transformers fastapi uvicorn safetensors

2️⃣ 直接推論を実行する

モデルをローカルで直接テストしたい場合は、inference.py を実行します。

python inference.py

サンプルコード（inference.py）

import torch
from transformers import DistilBertTokenizer, DistilBertForSequenceClassification

# 1. モデルをロードする
model_path = "./distilbert-question-detector"
tokenizer = DistilBertTokenizer.from_pretrained(model_path)
model = DistilBertForSequenceClassification.from_pretrained(model_path)
model.eval()

# 2. 推論を実行する
text = "Is this a question?"
inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=128)

with torch.no_grad():
    outputs = model(**inputs)
    logits = outputs.logits
    probabilities = torch.nn.functional.softmax(logits, dim=-1)

predicted_class = torch.argmax(probabilities, dim=-1).item()

print(f"Probabilities: {probabilities}")
print(f"Predicted class: {predicted_class}")  # 1 は疑問文、0 は疑問文ではないことを表す

3️⃣ API を実行する

FastAPI を使用して HTTP インターフェースをデプロイすることもできます。これにより、他のアプリケーションが HTTP リクエストを介してモデルにアクセスできるようになります。

uvicorn app:app --host 0.0.0.0 --port 8000

サンプル API コード（app.py）

from fastapi import FastAPI
import torch
from transformers import DistilBertTokenizer, DistilBertForSequenceClassification

app = FastAPI()

# モデルをロードする
model_path = "./distilbert-question-detector/checkpoint-5150"
tokenizer = DistilBertTokenizer.from_pretrained(model_path)
model = DistilBertForSequenceClassification.from_pretrained(model_path)
model.eval()

@app.post("/predict/")
async def predict(text: str):
    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=128)

    with torch.no_grad():
        outputs = model(**inputs)
        logits = outputs.logits
        probabilities = torch.nn.functional.softmax(logits, dim=-1)

    predicted_class = torch.argmax(probabilities, dim=-1).item()
    return {"text": text, "probabilities": probabilities.tolist(), "predicted_class": predicted_class}

API を起動した後、以下のコマンドでテストできます。

curl -X 'POST' \
  'http://127.0.0.1:8000/predict/' \
  -H 'Content-Type: application/json' \
  -d '{"text": "Is this a valid question?"}'

📌 結果の説明

predicted_class: 0 は、入力テキストが条件を満たすことを意味します。
predicted_class: 1 は、入力テキストが条件を満たさないことを意味します。

サンプル結果

{
    "text": "Is this a valid question?",
    "probabilities": [[0.9266, 0.0734]],
    "predicted_class": 0
}

📄 ライセンス

このプロジェクトは AFL-3.0 ライセンスの下で公開されています。

プロパティ	詳細
モデルタイプ	DistilBERT ベースのシーケンス分類モデル
パイプラインタグ	テキスト分類
評価指標	正確度
ベースモデル	distilbert/distilbert-base-uncased
タグ	tarot、question-detector