Tarot_Question_Detector開源模型 - 精準檢測文本是否為塔羅占卜問題

首頁

Tarot Question Detector

由AlexTANG-JX開發

基於 DistilBERT 的文本分類模型，用於檢測輸入文本是否為符合塔羅占卜的問題。

文本分類

Safetensors

英語#塔羅問題識別 #輕量級BERT #英文文本分類

下載量 33

發布時間 : 3/13/2025

模型概述

該模型基於 DistilBERT 架構，專門用於判斷輸入文本是否符合塔羅占卜問題的特徵。適用於占卜應用中的問題篩選場景。

模型特點

輕量級模型

基於 DistilBERT 架構，比標準 BERT 模型更小更快，同時保持較高準確率。

專門優化

針對塔羅占卜類問題的文本特徵進行了專門訓練和優化。

簡單易用

提供直接推理腳本和 API 部署方案，便於集成到各類應用中。

模型能力

文本分類

問題檢測

占卜問題識別

使用案例

占卜應用

占卜問題篩選

在塔羅牌占卜應用中自動篩選出有效的問題文本

準確識別符合占卜要求的問題

用戶輸入驗證

驗證用戶輸入是否符合占卜問題的格式要求

提高占卜系統的輸入質量

🚀 DistilBERT 占卜問題檢測模型

本項目提供了一個基於 DistilBERT 的占卜問題檢測模型，可用於判斷輸入文本是否為符合塔羅占卜的問題，為塔羅占卜相關應用提供了有力的文本分類支持。

🚀 快速開始

1️⃣ 安裝依賴

請確保你的環境已安裝 Python 3.8+，然後運行以下命令安裝所需的依賴庫：

pip install torch transformers fastapi uvicorn safetensors

2️⃣ 直接運行推理

如果你想直接在本地測試模型，可以運行 inference.py：

python inference.py

基礎用法

import torch
from transformers import DistilBertTokenizer, DistilBertForSequenceClassification

# 1. 加載模型
model_path = "./distilbert-question-detector"
tokenizer = DistilBertTokenizer.from_pretrained(model_path)
model = DistilBertForSequenceClassification.from_pretrained(model_path)
model.eval()

# 2. 進行推理
text = "Is this a question?"
inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=128)

with torch.no_grad():
    outputs = model(**inputs)
    logits = outputs.logits
    probabilities = torch.nn.functional.softmax(logits, dim=-1)

predicted_class = torch.argmax(probabilities, dim=-1).item()

print(f"Probabilities: {probabilities}")
print(f"Predicted class: {predicted_class}")  # 1 代表是疑問句，0 代表不是

3️⃣ 運行 API

你也可以使用 FastAPI 部署一個 HTTP 接口，允許其他應用通過 HTTP 請求訪問模型。

uvicorn app:app --host 0.0.0.0 --port 8000

高級用法

from fastapi import FastAPI
import torch
from transformers import DistilBertTokenizer, DistilBertForSequenceClassification

app = FastAPI()

# 加載模型
model_path = "./distilbert-question-detector/checkpoint-5150"
tokenizer = DistilBertTokenizer.from_pretrained(model_path)
model = DistilBertForSequenceClassification.from_pretrained(model_path)
model.eval()

@app.post("/predict/")
async def predict(text: str):
    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=128)

    with torch.no_grad():
        outputs = model(**inputs)
        logits = outputs.logits
        probabilities = torch.nn.functional.softmax(logits, dim=-1)

    predicted_class = torch.argmax(probabilities, dim=-1).item()
    return {"text": text, "probabilities": probabilities.tolist(), "predicted_class": predicted_class}

API 運行後，可通過以下方式測試：

curl -X 'POST' \
  'http://127.0.0.1:8000/predict/' \
  -H 'Content-Type: application/json' \
  -d '{"text": "Is this a valid question?"}'

📂 目錄結構

屬性	詳情
model.safetensors	訓練好的模型權重文件
config.json	模型架構的配置文件
tokenizer.json	分詞器的配置文件
special_tokens_map.json	特殊標記的配置文件
vocab.txt	分詞器的詞彙文件

📌 結果說明

predicted_class: 0 代表輸入文本是符合條件
predicted_class: 1 代表輸入文本不符合條件

示例結果

{
    "text": "Is this a valid question?",
    "probabilities": [[0.9266, 0.0734]],
    "predicted_class": 0
}

📄 許可證

本項目採用 AFL-3.0 許可證。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫