モデル概要
モデル特徴
モデル能力
使用事例
🚀 ギヨーム・テル
ギヨーム・テルは、Mistral Open-Hermes 2.5をベースにしたフランス語の大規模言語モデル(LLM)です。ソースの追跡可能性と説明可能性を備えたRAG(Retrieval Augmented Generation)向けに最適化されています。
🚀 クイックスタート
ギヨーム・テルは、フランスの行政ソースに基づくテキスト生成の検証可能性を向上させることを目的としています。質問と5つのソースの選択肢から、引用に特別なパラメータを持つ出所付きの回答を生成します。
✨ 主な機能
- フランスの行政手続きに関する質問に対する回答生成。
- RAG技術を用いた出所付きの回答生成。
- 回答の検証可能性と説明可能性の向上。
📦 インストール
ドキュメントにインストール手順に関する記載がありません。
💻 使用例
基本的な使用法
<|im_start|>system
Tu es Albert, le chatbot des Maisons France Service qui donne des réponses sourcées.<|im_end|>
<|im_start|>user
Ecrit un texte référencé en réponse à cette question : Quelles sont les étapes de la procédure de rétablissement en cas de surendettement ?
Les références doivent être citées de cette manière : texte rédigé<ref text=\"[passage pertinent dans la référence]\">[\"identifiant de la référence\"]</ref>Si les références ne permettent pas de répondre, qu'il n'y a pas de réponse.
Les cinq références disponibles :
10965c7bc7a8e185_0 :(…)
4c4511d1c0e6dc4c_0 :(…)
b8d3342e4ac89fe9_0 :(…)
28e7fcf81deee0ff_0 :(…)
e568bebd8fb112ee_0 :(…)
高度な使用法
ドキュメントに高度な使用法の例がありません。
📚 ドキュメント
モデルの詳細
モデルの説明
ギヨーム・テルは、フランスの行政ソースに基づくテキスト生成の検証可能性を向上させることを目的としています。質問と5つのソースの選択肢から、引用に特別なパラメータを持つ出所付きの回答を生成します。
属性 | 详情 |
---|---|
開発者 | Etalab (Service du Datalab) - Direction Interministérielle du Numérique |
バージョン | Guillaume-Tell-base |
モデルタイプ | Transformers, Text-Generation |
ライセンス | Apache-2.0 |
ファインチューニング元のモデル | OpenHermes-2.5-Mistral-7B |
使用方法
作成背景
ギヨーム・テルは、フランス政府の省庁間の生成AIツールであるALBERT用に開発されました。具体的には、人工知能に基づくフランスサービスアドバイザー支援モデルの実験の一環として開発されました。ギヨーム・テルは、LLMに直面するアドバイザーの特定のニーズを満たすために設計されており、具体的には、Albertによって生成された回答を検証し、それらをフランスサービスセンターで受け入れられたユーザーに送信する前にその正確性を確保することを目的としています。
モデルの目的と制限
ギヨーム・テルは言語モデルであり、会話能力と出所付きの情報検索能力を備えています。フランスの行政(例:行政手続き)に関する質問に対する回答を、その知識ベース(RAG)から関連する情報を取得し、それを合成して生成するために使用できます。
ギヨーム・テルは一次レベルの回答を提供し、複雑な行政回答を提供することはできません。フランスの行政分野以外の質問には回答できません。回答はフランス語のみで提供されます。
使用事例とユーザー
このモデルは、フランスの行政機関の公務員が行政情報の検索を容易にするために使用することを想定しています。このモデルを、その使用方法について特別なトレーニングを受けておらず、行政手続きに関する専門知識が不足している人々、例えば公共サービスの利用者の手に直接渡すことはお勧めしません。実際、すべてのLLMと同様に、ギヨーム・テルには誤り(「幻覚」)や見落としのリスクがあり、訓練を受けていない人はこれらを検出することができません。
例
質問: Quelles sont les étapes de la procédure de rétablissement en cas de surendettement ?
ソース:
- 10965c7bc7a8e185_0 : Surendettement : rétablissement personnel avec liquidation judiciaire. La procédure de rétablissement consiste à effacer les dettes d'une personne surendettée…
- 4c4511d1c0e6dc4c_0 : Surendettement : rétablissement personnel sans liquidation judiciaire. La procédure de rétablissement personnel consiste à effacer les dettes
- b8d3342e4ac89fe9_0 : Peut-on être saisi pendant la procédure de surendettement ? Dès le dépôt du dossier de surendettement. Durée de la suspension…
- n28e7fcf81deee0ff_0 : Surendettement : rétablissement personnel avec liquidation judiciaire. Conditions. Personnes concernées. Une procédure de rétablissement personnel avec liquidation judiciaire est engagée…
- 568bebd8fb112ee_0 : Peut-on être saisi pendant la procédure de surendettement ? Dès que le dossier est recevable…
結果: La procédure de rétablissement en cas de surendettement comporte plusieurs étapes. Tout d'abord, la personne concernée doit répondre à certaines conditions pour être éligible à cette procédure. Ensuite, la commission de surendettement ouvre la procédure avec l'accord du surendetté. Si le surendetté possède un patrimoine pouvant être vendu, une liquidation judiciaire est prononcée<ref text="Lorsque le surendetté possède un patrimoine pouvant être vendu, la procédure de rétablissement consiste à effacer les dettes et est prononcée avec liquidation judiciaire (vente des biens).">[28e7fcf81deee0ff_0]</ref>. Dans le cas contraire, une procédure sans liquidation judiciaire est engagée<ref text="Elle est prononcée sans liquidation judiciaire (c'est-à-dire sans vente des biens) lorsque la personne surendettée ne possède pas de patrimoine.">[4c4511d1c0e6dc4c_0]</ref>.
Pendant la procédure, la suspension de toute action juridique contre le surendetté est possible<ref text="Dès le dépôt du dossier de surendettement. Durée de la suspension. La suspension, si elle est accordée, est acquise selon les cas jusqu'à l'un des événements suivants : Décision d'irrecevabilité du dossier Approbation du plan conventionnel de redressement Décision de mesures imposées Jugement prononçant un rétablissement personnel sans liquidation judiciaire Jugement d'ouverture d'une procédure de rétablissement personnel avec liquidation judiciaire Elle ne peut toutefois pas dépasser 2 ans.">[b8d3342e4ac89fe9_0]</ref>.
Enfin, la clôture de la procédure se fait par jugement qui permet l'effacement des dettes<ref text="Jugement prononçant un rétablissement personnel sans liquidation judiciaire Jugement d'ouverture d'une procédure de rétablissement personnel avec liquidation judiciaire">[28e7fcf81deee0ff_0]</ref>.
プロンプト
プロンプトの形式
MistralやOpen-Hermes 2.5と同様に、ギヨーム・テルの構文はchatmlに基づいています。特定のプロンプトと、質問にソースを追加するための事前定義された構文が必要です。
プロンプトの例:
<|im_start|>system
Tu es Albert, le chatbot des Maisons France Service qui donne des réponses sourcées.<|im_end|>
<|im_start|>user
Ecrit un texte référencé en réponse à cette question : Quelles sont les étapes de la procédure de rétablissement en cas de surendettement ?
Les références doivent être citées de cette manière : texte rédigé<ref text=\"[passage pertinent dans la référence]\">[\"identifiant de la référence\"]</ref>Si les références ne permettent pas de répondre, qu'il n'y a pas de réponse.
Les cinq références disponibles :
10965c7bc7a8e185_0 :(…)
4c4511d1c0e6dc4c_0 :(…)
b8d3342e4ac89fe9_0 :(…)
28e7fcf81deee0ff_0 :(…)
e568bebd8fb112ee_0 :(…)
ギヨーム・テルは現在、固定された5つのソースの選択肢でトレーニングおよびテストされています。より少ないまたは多いソースのセットでも機能するはずですが、まだ実験されていません。
ファインチューニングに関する情報
ギヨーム・テルは、LORAアプローチと4ビットの量子化を使用してファインチューニングされています。
- サービス・パブリック・フランスのデータに基づく3880の合成RAG命令。
- サービス・パブリック・フランスとOpen Hermesのデータに基づく5000のchatRAG命令。
ファインチューニングのコードfinetuning.py
は、Files and versions
セクションで入手できます。
ALBERTを使用したRAGタスク
RAG技術を使用して、モデルの回答の適切性を最適化することができます。これにより、質問に適した適切なデータに基づく回答を得ることができます。現在、ALBERTではこれを本番環境で行っています。
モデルのリリース時点で、ALBERTのRAGを実行するためのデータは以下のもので構成されています。
- サービス・パブリック・フランスのページを300語のチャンクに分割したもの。
用語集
- France services : 物理的な受付とデジタルの支援を組み合わせた地域組織のネットワークで、複数の公共サービスの行政手続きを支援するために利用者をサポートします。
- LLM (Large Language Model) : 大量のテキストデータを処理することで、人間の言語を理解し、生成することができるディープラーニングモデル。
- RAG (Retrieval Augmented Generation) : 追加のデータリソースを使用して、生成AIのパフォーマンスを向上させる技術で、再トレーニングする必要がありません。
📄 ライセンス
このモデルはApache-2.0ライセンスの下で提供されています。



