オープンソースで無料のbyt5-small-englishモデル - 英語テキスト処理に特化した超実用的なモデル！

ホーム

Byt5 Small English

hmbyt5によって開発

歴史的多言語および単一言語ByT5基礎モデル、現在のバージョンは英語テキスト処理に特化。

大規模言語モデル英語オープンソースライセンス:MIT #多言語固有表現認識 #歴史テキスト処理 #文字レベル事前学習

ダウンロード数 30

リリース時間 : 4/8/2023

モデル概要

ByT5アーキテクチャに基づく基礎言語モデル、英語テキスト向けに事前学習されており、様々な自然言語処理タスクに適用可能。

モデル特徴

歴史テキスト最適化

大英図書館書籍コーパスで訓練されており、歴史文献や書籍テキストの処理に特に適している。

マルチタスク適応

固有表現認識などの下流タスクで優れた性能を発揮、平均F1スコア85以上を達成。

効率的な訓練

単一のv3-8 TPUを使用して事前学習を行い、訓練効率が高い。

モデル能力

英語テキスト理解

固有表現認識

歴史文献処理

使用事例

学術研究

歴史文献分析

大英図書館の歴史書籍に対して固有表現認識と情報抽出を実施

英語AjMCデータセットでF1スコア85.65を達成

情報抽出

多言語固有表現認識

英語、ドイツ語、フランス語など多言語の固有表現認識タスクを処理

ドイツ語AjMCでF1スコア87.27、フランス語AjMCで84.44を達成

🚀 hmByT5 - 予備言語モデル

予備的な歴史的多言語および単言語のByT5モデルです。現在サポートされている言語は以下の通りです。

英語（大英図書館コーパス - 書籍）

詳細については、私たちのGitHubリポジトリを参照してください。

🚀 クイックスタート

このhmByT5は、予備的な歴史的多言語および単言語のByT5モデルです。特定の言語のコーパスを用いて構築され、下流タスクでの評価も行われています。

✨ 主な機能

現在英語（大英図書館コーパス - 書籍）をサポートしています。
Hugging Face Transformersの公式JAX/FLAXサンプルを使用して、単一のv3 - 8 TPUでByT5モデルを事前学習します。
下流タスク（NER）での評価を行っています。

📦 インストール

READMEに具体的なインストール手順が記載されていないため、このセクションは省略されます。

💻 使用例

READMEに具体的なコード例が記載されていないため、このセクションは省略されます。

📚 ドキュメント

事前学習

私たちは、Hugging Face Transformersの公式JAX/FLAXサンプルを使用して、単一のv3 - 8 TPUでByT5モデルを事前学習しています。学習に関する詳細はこちらで確認できます。

下流タスク（NER）での評価

私たちは、hmByT5モデルを下流タスクで評価しました。

モデル	英語AjMC	ドイツ語AjMC	フランス語AjMC	フィンランド語NewsEye	スウェーデン語NewsEye	オランダ語ICDAR	フランス語ICDAR	平均
`hmbyt5/byt5-small-english`	85.65 ± 1.21	87.27 ± 0.50	84.44 ± 0.79

謝辞

GoogleのTPU Research Cloud（TRC）からのCloud TPUを使用した研究を行っています。TPUへのアクセスを提供してくれたGoogleに心から感謝します❤️

📄 ライセンス

このプロジェクトはMITライセンスの下で提供されています。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご