Model Overview
Model Features
Model Capabilities
Use Cases
🚀 夫子•明察司法大模型
夫子•明察司法大模型由山東大學、浪潮雲、中國政法大學聯合研發,以ChatGLM為底座,基於大量司法語料訓練而成。它支持法條檢索、案例分析等功能,能為用戶提供精準的法律諮詢服務。
- 模型 huggingface 鏈接:https://huggingface.co/datasets/SDUIRLab/fuzi-mingcha-v1_0
- 數據 huggingface 鏈接:https://huggingface.co/datasets/SDUIRLab/fuzi-mingcha-v1_0-data
- GitHub 鏈接:https://github.com/irlab-sdu/fuzi.mingcha
- 數據 魔搭鏈接:https://www.modelscope.cn/datasets/furyton/fuzi-mingcha-v1_0-data
- 模型 魔搭鏈接:https://www.modelscope.cn/models/furyton/fuzi-mingcha-v1_0
🚀 快速開始
軟件依賴
pip install protobuf==3.20.0 transformers==4.27.1 icetk cpm_kernels
代碼調用
夫子•明察基於 ChatGLM 進行司法垂直領域增量訓練,所以其使用方法與 ChatGLM 相同。
可以通過如下代碼調用夫子•明察模型來生成對話:(也可以首先將參數下載至本地,後將 SDUIRLab/fuzi-mingcha-v1_0
改為權重的放置路徑)
>>> from transformers import AutoTokenizer, AutoModel
>>> tokenizer = AutoTokenizer.from_pretrained("SDUIRLab/fuzi-mingcha-v1_0", trust_remote_code=True)
>>> model = AutoModel.from_pretrained("SDUIRLab/fuzi-mingcha-v1_0", trust_remote_code=True).half().cuda()
>>> response, history = model.chat(tokenizer, "你好", history=[])
>>> print(response)
你好,有什麼我可以幫您解答的問題嗎?
>>> response, history = model.chat(tokenizer, "你能做什麼", history=history)
>>> print(response)
夫子·明察可以進行各種法律諮詢,包括刑法判決、民事法律、知識產權、行政訴訟等方面的問題。
pipeline 部署
請參考 GitHub 倉庫
✨ 主要特性
夫子•明察司法大模型具備如下三大特色:
- 基於法條檢索回覆:夫子•明察大模型能夠結合相關法條進行回覆生成。對於用戶的諮詢,夫子•明察大模型基於生成式檢索範式先初步引用相關法條,再檢索外部知識庫對所引法條進行校驗與確認,最終結合這些法條進行問題分析與回覆生成。這保證生成的回覆能夠基於與問題相關的法律依據,並根據這些依據提供深入的分析和建議,使回覆具有高權威性、高可靠性與高可信性。
- 基於案例檢索回覆:夫子•明察大模型能夠基於歷史相似案例對輸入案情進行分析。大模型能夠生成與用戶提供的案情相似的案情描述及判決結果,通過檢索外部數據庫得到真實的歷史案例,並將這些相似的歷史案例的信息用於輔助生成判決。生成的判決參考相關案例的法律依據,從而更加合理。用戶可以對照相似案例,從而更好地理解潛在的法律風險。
- 三段論推理判決:司法三段論,是把三段論的邏輯推理應用於司法實踐的一種思維方式和方法。類比於三段論的結構特徵,司法三段論就是法官在司法過程中將法律規範作為大前提,以案件事實為小前提,最終得出判決結果的一種推導方法。針對具體案件,夫子•明察大模型系統能夠自動分析案情,識別關鍵的事實和法律法規,生成一個邏輯嚴謹的三段論式判決預測。這個功能不僅提供了對案件可能結果的有力洞察,還有助於幫助用戶更好地理解案件的法律依據和潛在風險。
📚 詳細文檔
模型簡介
夫子•明察司法大模型是由山東大學、浪潮雲、中國政法大學聯合研發,以 ChatGLM 為大模型底座,基於海量中文無監督司法語料(包括各類判決文書、法律法規等)與有監督司法微調數據(包括法律問答、類案檢索)訓練的中文司法大模型。該模型支持法條檢索、案例分析、三段論推理判決以及司法對話等功能,旨在為用戶提供全方位、高精準的法律諮詢與解答服務。
訓練數據
夫子•明察司法大模型的訓練數據可分為兩大類別:中文無監督司法語料以及有監督司法微調數據。其中不僅涵蓋法律法規、司法解釋、判決文書等內容,同時還包括各類高質量司法任務數據集,例如法律問答、類案檢索和三段論式法律判決。內容豐富、優質海量的訓練數據,確保了對司法領域知識進行準確且全面的覆蓋,為夫子•明察司法大模型提供堅實的知識基礎。
以下為夫子·明察司法大模型增量預訓練、指令微調過程中所使用數據的統計信息:
類型 | 名稱 | 來源 | 數量 |
---|---|---|---|
中文無監督司法語料 | 法律法規 | LawRefBook | 3.22M |
中文無監督司法語料 | 裁判文書 | 裁判文書網 | 23M |
中文有監督司法微調數據 | 法條檢索回覆數據(自主構建) | 自主構建 | 32k |
中文有監督司法微調數據 | 法條檢索回覆數據(Lawyer LLaMA) | Lawyer LLaMA | 11k |
中文有監督司法微調數據 | 法條檢索回覆數據(lawGPT) | lawGPT | 35k |
中文有監督司法微調數據 | 案例檢索回覆數據(自主構建) | 自主構建 | 15k |
中文有監督司法微調數據 | 案例檢索回覆數據(CAIL) | CAIL | 10k |
中文有監督司法微調數據 | 三段論推理判決數據 | 自主構建 | 11k |
中文有監督司法微調數據 | 多輪法律對話數據 | Hanfei | 40k |
通用領域微調數據 | Alpaca指令微調數據 | Alpaca | 100K |
通用領域微調數據 | Belle指令微調數據 | Belle | 10k |
通用領域微調數據 | OL - CC指令微調數據 | 智源 | 10K |
以下部分自主構建的數據樣例:
法條檢索回覆數據
# 法條詢問
{
"instruction": "",
"input": "中華人民共和國義務教育法的第三十條是什麼?",
"output": "中華人民共和國義務教育法的第三十條規定如下\n教師應當取得國家規定的教師資格。\n國家建立統一的義務教育教師職務制度。教師職務分為初級職務、中級職務和高級職務。\n"
},
# 法條補全
{
"instruction": "請補充以下法條缺失部分",
"input": "高等教育自學考試暫行條例第十七條規定:\n高等教育自學考試的命題由全國考委統籌安排,分別採取全國統一命題、區域命題、省級命題三種辦法",
"output": "逐步建立題庫,實現必要的命題標準化。\n試題(包括副題)及參考答案、評分標準啟用前屬絕密材料。"
},
# 根據案情生成相關法條
{
"instruction": "請根據基本案情,給出適用的法條。",
"input": "基本案情:\n廣東省鶴山市人民檢察院指控被告人李某甲於2014年7月7日9時許,在鶴山市宅梧鎮雙和公路宅梧收費站附近路段被民警抓獲。民警當場從李某甲身上搜獲搜獲白色晶體38小包。經鑑定,從李某甲處繳獲的白色晶體淨重12.9克,檢出甲基苯丙胺成分。被告人李某甲到案後如實供述自己的罪行,可以從輕處罰。建議對被告人判處有期徒刑六個月至一年六個月,並處罰金。提請法院依法懲處。上述事實,被告人李某甲在開庭審理過程中亦無異議,並有抓獲被告人及破案的經過材料、被告人的供述、證人李X鋒的證言、扣押物品清單、鑑定意見、辨認筆錄、現場勘某足以認定。",
"output": "適用法條:\n 《中華人民共和國刑法》第三百四十八條 【非法持有毒品罪】,李某甲非法持有甲基苯丙胺十克以上不滿五十克,罪名成立,應判處三年以下有期徒刑,並處罰金。"
},
# 根據案情結合相關法條進行分析
{
"instruction": "請根據以下案情進行判決並結合相關法律進行分析",
"input": "基本案情:\n通過A公司經營的旅遊App預定境外客房,支付方式為“到店支付”,訂單下單後即被從銀行卡中扣除房款,後原告未入住。原告認為應當到店後付款,A公司先行違約,要求取消訂單。A公司認為其已經在服務條款中就“到店支付”補充說明“部分酒店住宿可能會對您的銀行卡預先收取全額預訂費用”,不構成違約,拒絕退款。\n鄔某將A公司起訴至法院,請求判令退還預扣的房款。\n",
"output": "裁判結果:\n經審理認為,對“到店支付”的通常理解應為用戶到酒店辦理住宿時才會支付款項,未入住之前不需要支付。即使該條款後補充說明部分酒店會“預先收取全額預訂費用”,但對這種例外情形應當進行特別提示和說明,如果只在內容複雜繁多的條款中規定,不足以起到提示的作用,A公司作為預定服務的提供者應當承擔責任。\n最終,法院支持鄔某退還房款的訴訟請求。\n典型意義:\n字經濟、互聯網產業飛速發展的大背景下,線上交易中企業基本都採用格式條款的方式與消費者建立契約關係。但是,在格式條款發揮其便捷、高效、積極作用的同時,因其本身具有的單方提供、內容固定的特質所帶來的問題和風險,也不容忽視。\n法律明確賦予了格式條款提供者進行提示說明的義務,民法典第四百九十六條規定:“提供格式條款的一方未履行提示或者說明義務,致使對方沒有注意或者理解與其有重大利害關係的條款的,對方可以主張該條款不成為合同的內容。\n”提供格式條款的企業應當基於公平、誠信原則,依法、合理制定格式條款的內容,並對於履行方式等與消費者有重大利害關係的條款,向消費者進行特別的提醒和說明,從而維護交易秩序,平衡雙方利益,促進行業發展。本案的裁判進一步釐清了網絡服務提供者作為提供格式條款一方的責任,引導互聯網交易模式更加符合契約自由和契約正義的精神。\n"
}
案例檢索回覆數據
{
"instruction": "請根據以下輸入生成相關的案例和判決結果",
"input": "被指控的人在某地某時盜走了三輛電動車。他有精神障礙,但被認定具備完全刑事責任能力。",
"output": "基本案情:\n 河南省駐馬店市驛城區人民檢察院指控: 1.2016年4月12日13時許,被告人曹某某到駐馬店市驛城區金雀路西段開發區高中院內4號樓前,將被害人劉某停放的一輛白色“高仕”牌電動車盜走。經鑑定,被盜電動車價值1064元。 2.2016年4月12日23時許,被告人曹某某到駐馬店市驛城區金雀路西段開發區高中院內4號樓前,將被害人付某某停放的一輛白色“愛瑪”牌電動車盜走。經鑑定,被盜電動車價值1320元。 3.2016年4月13日12時許,被告人曹某某到駐馬店市驛城區金雀路西段開發區高中院內4號樓前,將被害人拜某某停放的一輛紅色“高仕”牌電動車盜走。經鑑定,被盜電動車價值1200元。 另查明,案發後,公安機關接被害人報警後,通過查看案發現場監控和走訪群眾,確定上述三起電動車被盜均系被告人曹某某實施。 還查明,經駐馬店安康法醫精神病司法鑑定所鑑定,被告人曹某某系酒精所致精神障礙(依賴綜合徵),具備完全刑事責任能力,有受審能力。 上述事實,被告人曹某某在開庭審理過程中亦無異議,並有被害人陳述、證人證言、鑑定意見、物證照片、視聽資料、到案經過、戶籍證明等證據證實,足以認定。 \n本院認為,被告人曹某某以非法佔有為目的,多次採取秘密手段竊取他人財物,價值3584元,數額較大,其行為已構成盜竊罪。公訴機關對曹某某犯罪指控成立,予以支持。曹某某有劣跡,其當庭自願認罪,量刑時均可酌予考慮。根據曹某某犯罪的事實、性質、情節以及對社會的危害程度,依照《中華人民共和國刑法》第二百六十四條和第十八條第四款之規定,判決如下:\n 被告人曹某某犯盜竊罪,判處拘役五個月,並處罰金人民幣二千元(罰金限判決生效後十日內繳納)。 (刑期從判決執行之日起計算。判決執行以前先行羈押的,羈押一日折抵刑期一日。即自2016年4月13日起至2016年9月12日止)。 如不服本判決,可在接到判決書的第二日起十日內,通過本院或者直接向駐馬店市中級人民法院提出上訴。書面上訴的,應當提交上訴狀正本一份,副本二份。"
}
三段論推理判決數據
{
"instruction": "請根據基本案情,利用三段論的推理方式得到判決結果,判決結果包括:1.罪名;\n2.刑期。",
"input": "基本案情:\n廣東省鶴山市人民檢察院指控被告人李某甲於2014年7月7日9時許,在鶴山市宅梧鎮雙和公路宅梧收費站附近路段被民警抓獲。民警當場從李某甲身上搜獲搜獲白色晶體38小包。經鑑定,從李某甲處繳獲的白色晶體淨重12.9克,檢出甲基苯丙胺成分。被告人李某甲到案後如實供述自己的罪行,可以從輕處罰。建議對被告人判處有期徒刑六個月至一年六個月,並處罰金。提請法院依法懲處。上述事實,被告人李某甲在開庭審理過程中亦無異議,並有抓獲被告人及破案的經過材料、被告人的供述、證人李X鋒的證言、扣押物品清單、鑑定意見、辨認筆錄、現場勘某足以認定。",
"output": "犯罪要件:\n犯罪主體:\n 犯罪主體為被告人李某甲,構成要件為完全行為能力人。\n 犯罪客體:\n 犯罪客體為社會公共安全,包括禁毒法規所保護的社會關係。被告人李某甲非法持有、販賣毒品,嚴重危害社會公共安全,破壞社會治安秩序。\n 犯罪主觀要件:\n 犯罪主觀方面為故意,李某甲明知所持有的白色晶體為甲基苯丙胺,仍然故意販賣毒品。犯罪意圖為非法牟利。\n 犯罪客觀要件:\n 犯罪時間:2014年7月7日9時許。犯罪地點:廣東省鶴山市宅梧鎮雙和公路宅梧收費站附近路段。犯罪行為:攜帶白色晶體38小包,淨重12.9克,檢出甲基苯丙胺成分。犯罪結果:被民警抓獲。\n 適用法條:\n 《中華人民共和國刑法》第三百四十八條 【非法持有毒品罪】,李某甲非法持有甲基苯丙胺十克以上不滿五十克,罪名成立,應判處三年以下有期徒刑,並處罰金。 \n 判決結果:\n 罪名:非法持有毒品罪刑期:三年以下有期徒刑,並處罰金。 "
}
注:其中我們自主構建的數據集,如三段論推理判決數據集等,將會在近期以論文的形式公開,感謝您的關注和理解。
效果展示
以下為夫子·明察三大特色的效果展示:
基於法條檢索回覆
 基於案例檢索回覆
三段論推理判決
    以下為夫子·明察與其他法律大模型、ChatGLM的效果對比:
法律諮詢
**Query:政府公務員可以成為企業合夥人嗎?** | **Model** | **Response** | | :--------: | -- | | 夫子•明察(模型直接回復) | 政府公務員不能成為企業合夥人,因為政府公務員的職責是為人民服務,而不是為自己謀取利益。在企業合夥過程中,政府公務員不能利用自己的職權和影響力來干預企業的經營管理,也不能參與企業的利潤分配。如果政府公務員想要成為企業合夥人,需要符合相關法律法規的規定,取得相應的資格和條件。 | | 夫子•明察
(經過法條檢索) | 不可以。根據《中華人民共和國合夥企業法》第九條規定,申請設立合夥企業時,應當向企業登記機關提交登記申請書、合夥協議書、合夥人身份證明等文件。其中,合夥人為國家機關工作人員的,應當提交其職務證明文件,並註明其委派代表的職務。因此,政府公務員不能成為企業合夥人。 | | 其他法律模型 | 根據《中華人民共和國公務員法》第X條規定,公務員離開原任職務後,可以在一定期限內從事與原任職務有關的工作,但不得利用原任職務或者職權從事營利活動。因此,政府公務員可以成為企業合夥人,但必須符合上述規定,不能利用原任職務或職權從事營利活動。| | ChatGLM | 公務員不可以成為企業合夥人,因為公務員身份和職業責任不允許從事營利性活動,包括成為企業合夥人。根據《公務員法》的規定,公務員必須履行工作職責,同時遵守職業道德和職業操守,不得從事與工作無關的活動,也不得利用職務之便謀取私利。公務員之間也不得建立商業關係或者成為合夥人。公務員成為企業合夥人可能會違反法律法規,不僅會影響公務員的形象和信譽,也會損害政府的公信力和形象。因此,政府公務員不得成為企業合夥人。|
案例分析
**Query:分析案例:徐某(男)與李某(女)婚後育有一子(1歲半)、一女(8歲),兩人準備離婚,都想爭取孩子撫養權。徐某經濟狀況較好,工資收入是李某的數倍,認為自己勝券在握。李某雖收入不高,但女兒更願意隨其生活。** | **Model** | **Response** | | :--------: | -- | | 夫子•明察 | 根據《民法典》第一千零八十四條規定,離婚後,子女無論由父或母直接撫養,仍是父母雙方的子女。離婚後,父母對於子女仍有撫養、教育、保護的權利和義務。根據《民法典》第一千零八十五條規定,離婚後,子女由一方直接撫養的,另一方應當負擔部分或全部撫養費。負擔費用的多少和期限的長短,由雙方協議;協議不成的,由人民法院判決。
根據《民法典》第一千零八十六條規定,離婚後,不直接撫養子女的父或母,有探望子女的權利,另一方有協助的義務。行使探望權利的方式、時間由當事人協議;協議不成的,由人民法院判決。
在本案中,徐某與李某都想爭取孩子撫養權,應當根據最有利於未成年子女的原則依法判決。如果雙方不能達成協議,應當由人民法院依照相關規定進行判決。此外,由於女兒還在上學,生活費用和撫養費用可能會增加,應當根據實際情況進行適當的調整。| | 其他法律模型 | 根據《中華人民共和國婚姻法》的規定,子女撫養權的判決應當以未成年子女的利益為出發點,綜合考慮父母的經濟條件、身體情況、家庭環境等情況,最終確定撫養人。因此,在本案中,法院會綜合考慮雙方的經濟能力、工作時間、居住環境等因素來判斷撫養權歸屬問題。
首先,徐某的經濟條件好,收入水平較高,可以為孩子的成長提供更好的物質條件。但是,如果李某能夠證明自己有更好的照顧孩子的能力,或者孩子的身心健康需要由她來照顧,那麼她也有可能獲得撫養權。
其次,女兒年齡較大,已經八歲,對於她的意願也應該有所考慮。如果女兒表示願意隨母親生活,法院也會考慮到這一因素。
綜上所述,在本案中,法院會綜合考慮雙方的經濟能力、照顧孩子的能力、女兒的意願等因素來判決撫養權歸屬問題。建議雙方積極溝通協商,儘量達成一致意見,並在法律程序中維護自己的合法權益。| | ChatGLM | 這個案例涉及到孩子撫養權的問題,需要考慮多個因素來做出決定。以下是一些分析和建議:
1. 孩子的年齡和需求:孩子在不同的年齡段有不同的需求和特點。1歲半的孩子通常需要關注他們的日常生活,如飲食、睡眠、安全等。8歲的孩子已經進入了青春期,需要更多的關 注和支持,以幫助他們發展社交技能和情感健康。因此,撫養權的歸屬需要考慮孩子的需求和年齡。
...
綜合以上因素,如果徐某的經濟狀況更好,並且孩子更願意跟李某生活,那麼李某可能會獲得孩子的撫養權。但最終結果還需要根據法律程序來裁決,因此,建議雙方在法律框架內進行溝通和協商,以達成一個最好的解決方案。|
Query:21 歲女子甲與25 歲男子乙在網上聊天后產生好感,乙將甲發給其的私密照片保存。後乙要求與甲結婚,甲不同意。乙威脅要公佈其照片,甲只好同意結婚並辦理了登記。甲是否可以自婚姻登記之日起 1年內請求撤銷該婚姻?
| **Model** | **Response** | | :--------: | -- | | 夫子•明察 | 據《民法典》第一千零五十二條規定,如果甲因脅迫結婚,可以在結婚登記之日起一年內請求撤銷婚姻。而根據《民法典》第一千零五十三條規定,如果乙在甲辦理結婚登記前洩露甲的私密照片,會對甲造成精神上的傷害,也會對甲的撤銷請求權產生影響。因此,如果乙在甲辦理結婚登記前洩露甲的私密照片,甲可以向人民法院請求撤銷婚姻。但需要注意的是,請求撤銷婚姻的,應當自脅迫行為終止之日起一年內提出。如果甲被乙威脅要公佈其照片,甲也可以在結婚登記之日起一年內請求撤銷該婚姻。| | 其他法律模型 | 依據《民法典》第一千零五十二條規定,因脅迫結婚的,受脅迫的一方可以向人民法院請求撤銷婚姻。因此,如果甲是在受到脅迫的情況下同意結婚的,那麼甲可以在自婚姻登記之日起一年內向人民法院請求撤銷婚姻。但是,需要進一步瞭解的是,是否存在脅迫的情況,以及脅迫的方式和手段等。另外,根據《民法典》第一千零四十六條規定,結婚應當男女雙方完全自願,禁止任何一方對另一方加以強迫,禁止任何組織或者個人加以干涉。如果甲是在完全自願的情況下同意結婚的,那麼甲無法請求撤銷婚姻。
綜上所述,需要進一步瞭解甲同意結婚的具體情況,以及是否存在脅迫的情況。建議甲諮詢專業律師,尋求專業的法律幫助。| | ChatGLM | 根據中國《婚姻法》的規定,婚姻關係是自婚姻開始時即存在的,非經法定程序而不能消滅。婚姻無效的原因有:(一)重婚的;(二)有禁止結婚的疾病而結婚無效的;(三)因脅迫而結婚無效的;(四)自始沒有感情而結婚無效的;(五)因欺詐而結婚無效的。婚姻無效、可依法撤銷。甲可以自婚姻登記之日起 1 年內向當地人民法院提起撤銷婚姻的訴訟。|
📄 許可證
本倉庫的代碼依照 Apache - 2.0 協議開源,我們對 ChatGLM - 6B 模型的權重的使用遵循 Model License。
致謝
本項目基於如下開源項目展開,在此對相關項目和開發人員表示感謝:
- Alpaca
- BELLE
- ChatGLM - 6B
- ChatGLM - Efficient - Tuning
- Lawyer LLaMA
- LaWGPT
- JEC - QA
- PKU Opendata
- LawRefBook
- CAIL 2018 - 2021
- HanFei
- BAAI
聲明
本項目的內容僅供學術研究之用,不得用於商業或其他可能對社會造成危害的用途。 在涉及第三方代碼的使用時,請切實遵守相關的開源協議。 本項目中大模型提供的法律問答、判決預測等功能僅供參考,不構成法律意見。 如果您需要法律援助等服務,請尋求專業的法律從業者的幫助。
引用
如果本項目有幫助到您的研究,請引用我們:
@misc{fuzi.mingcha,
title={fuzi.mingcha},
author={Shiguang Wu, Zhongkun Liu, Zhen Zhang, Zheng Chen, Wentao Deng, Wenhao Zhang, Jiyuan Yang, Zhitao Yao, Yougang Lyu, Xin Xin, Shen Gao, Pengjie Ren, Zhaochun Ren, Zhumin Chen},
year={2023},
publisher={GitHub},
journal={GitHub repository},
howpublished={\url{https://github.com/irlab-sdu/fuzi.mingcha}},
}



