Genderizeオープンソース姓名性別分類モデル - 姓名を入力するだけで性別を正確に予測できます

ホーム

Genderize

imranali291によって開発

BERTベースの名前性別分類モデルで、入力された名前から性別を予測します。

テキスト分類

Safetensors

英語オープンソースライセンス:MIT #名前性別予測 #BERTファインチューニング #パーソナライズドマーケティング

ダウンロード数 65

リリース時間 : 1/31/2025

モデル概要

このモデルは事前学習済みのBERTモデルを基盤としており、ファインチューニングにより入力された名前の性別分類を実現します。名前による性別識別が必要なアプリケーションシナリオに適しています。

モデル特徴

BERTファインチューニング

事前学習済みのBERTモデルを利用したファインチューニングにより、名前性別分類の精度を向上させます。

軽量モデル

モデルのパラメータ数が適度で、迅速な展開と適用に適しています。

多様なシナリオ対応

パーソナライズドマーケティングやユーザープロファイリングなど、性別識別が必要な様々なシナリオに適用可能です。

モデル能力

名前性別分類

テキスト分類

性別予測

使用事例

パーソナライズドマーケティング

ターゲティング広告配信

ユーザーの名前から性別を予測し、より精度の高い広告配信を実現します。

広告のクリック率とコンバージョン率の向上。

ユーザープロファイリング

性別分析

ユーザー登録や調査において、名前から性別情報を補完します。

ユーザープロファイルの充実化とデータ分析のサポート。

🚀 名前による性別分類

このモデルは、入力された名前に基づいて性別を分類します。事前学習済みのBERTモデルをベースに使用し、名前とそれに関連する性別のデータセットでファインチューニングされています。

🚀 クイックスタート

from transformers import AutoModelForSequenceClassification, AutoTokenizer

# Load the model and tokenizer from the Hub
model_name = "imranali291/genderize"
model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Example inference function
def predict_gender(name):
    inputs = tokenizer(name, return_tensors="pt", padding=True, truncation=True, max_length=32)
    outputs = model(**inputs)
    predicted_label = outputs.logits.argmax(dim=-1).item()
    return label_encoder.inverse_transform([predicted_label])[0]

print(predict_gender("Alex"))  # Example output: 'M'
print(predict_gender("Maria"))  # Example output: 'F'

✨ 主な機能

入力された名前から性別を分類することができます。
事前学習済みのBERTモデルをベースにしているため、高精度な分類が可能です。
名前に基づく性別識別が必要なアプリケーションの強化に役立ちます。

📦 インストール

このモデルを使用するには、transformersライブラリが必要です。以下のコマンドでインストールできます。

pip install transformers

💻 使用例

基本的な使用法

from transformers import AutoModelForSequenceClassification, AutoTokenizer

# Load the model and tokenizer from the Hub
model_name = "imranali291/genderize"
model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Example inference function
def predict_gender(name):
    inputs = tokenizer(name, return_tensors="pt", padding=True, truncation=True, max_length=32)
    outputs = model(**inputs)
    predicted_label = outputs.logits.argmax(dim=-1).item()
    return label_encoder.inverse_transform([predicted_label])[0]

print(predict_gender("Alex"))  # Example output: 'M'
print(predict_gender("Maria"))  # Example output: 'F'

📚 ドキュメント

モデル詳細

プロパティ	詳細
モデル名	Genderize
開発者	Imran Ali
モデルタイプ	テキスト分類
言語	英語
ライセンス	MIT

説明

学習詳細

学習データ: 名前と性別のデータセット（例：Dannel gender-nameデータセット）
学習手順: 分類ヘッド付きのBERTモデルを使用してファインチューニング
学習ハイパーパラメータ:
- バッチサイズ: 8
- 勾配累積ステップ: 1
- 学習率: 2e-5
- 総ステップ数: 20,005
- 学習可能なパラメータ数: 109,483,778 (1.9M)