🚀 Titlewave: t5-base
Titlewaveは、Stack Overflowの質問により良いタイトルを選ぶのを支援するChrome拡張機能です。詳細については、https://github.com/tennessejoyce/TitleWave を参照してください。このモデルは、Titlewaveプロジェクトで使用される2つのNLPモデルの1つで、質問本文に基づいて新しいタイトルを提案することを目的としています。もう一方のモデル(https://huggingface.co/tennessejoyce/titlewave-bert-base-uncased) は、タイトルのみに基づいて質問が回答されるかどうかを分類します。
🚀 クイックスタート
Stack Overflowの投稿にさまざまなタイトルを試してみて、どのタイトルが回答を得る可能性が最も高いかを確認してください。このモデルは、https://github.com/tennessejoyce/TitleWave のインストール手順に従って、Chrome拡張機能としてブラウザで使用することができます。または、Pythonで次のようにロードすることもできます(これにより、モデルが自動的にマシンにダウンロードされます)。
>>> from transformers import pipeline
>>> classifier = pipeline('summarization', model='tennessejoyce/titlewave-t5-base')
>>> body = """"Example question body."""
>>> classifier(body)
[{'summary_text': 'Example title suggestion?'}]
✨ 主な機能
- 質問本文に基づいてStack Overflowの質問に新しいタイトルを提案します。
- タイトルのみに基づいて質問が回答されるかどうかを分類するコンパニオンモデルと連携します。
📦 インストール
このモデルは、Chrome拡張機能として使用することができます。インストール手順については、https://github.com/tennessejoyce/TitleWave を参照してください。または、Pythonで次のようにロードすることもできます。
from transformers import pipeline
classifier = pipeline('summarization', model='tennessejoyce/titlewave-t5-base')
💻 使用例
基本的な使用法
>>> from transformers import pipeline
>>> classifier = pipeline('summarization', model='tennessejoyce/titlewave-t5-base')
>>> body = """"Example question body."""
>>> classifier(body)
[{'summary_text': 'Example title suggestion?'}]
📚 ドキュメント
モデルの説明
Titlewaveは、Stack Overflowの質問により良いタイトルを選ぶのを支援するChrome拡張機能です。このモデルは、質問本文に基づいて新しいタイトルを提案することを目的としています。
想定される使用方法
Stack Overflowの投稿にさまざまなタイトルを試してみて、どのタイトルが回答を得る可能性が最も高いかを確認してください。
トレーニングデータ
重みは、BookCorpusと英語版WikipediaでトレーニングされたBERTベースモデル (https://huggingface.co/bert-base-uncased) から初期化されました。その後、モデルは以前のStack Overflow投稿タイトルのデータセット (https://archive.org/details/stackexchange) でファインチューニングされました。具体的には、2017年から2019年までの3年間の投稿を使用し、クローズされた投稿を除外し、残りの投稿の25%をランダムに選択してトレーニングセットに使用しました。生成されるタイトルの品質を向上させるために、モデルは受け入れられた回答がある質問のみでトレーニングされました。
評価
テストセットにおけるタイトル生成モデルのパフォーマンスについては、https://github.com/tennessejoyce/TitleWave/blob/master/model_training/test_summarizer.ipynb を参照してください。
🔧 技術詳細
重みは、BERTベースモデル (https://huggingface.co/bert-base-uncased) から初期化され、Stack Overflowの投稿タイトルのデータセットでファインチューニングされました。トレーニングセットには、2017年から2019年までの3年間の投稿のうち、受け入れられた回答がある質問のみが含まれています。
📄 ライセンス
このモデルは、CC BY 4.0ライセンスの下で提供されています。