開源法律領域大模型“智海-錄問” - 助力法律智能應用，提升司法效能

首頁

Wisdominterrogatory

由ZhihaiLLM開發

智海-錄問是由浙江大學、阿里巴巴達摩院及華院計算聯合研發的法律領域大模型，專注於法律智能應用與司法效能提升。

大型語言模型

Transformers

支持多種語言開源協議:其他 #法律問答 #司法判例解析 #中文法律大模型

下載量 61

發布時間 : 9/2/2023

模型概述

基於Baichuan-7B架構的法律領域大模型，通過法律文書專項訓練和指令微調，具備專業法律問答能力。

模型特點

法律領域專業化

通過40GB法律文書專項訓練，注入專業法律知識

司法實踐導向

設計目標直接服務於司法效能提升和普法共享

交互式問答能力

經過10萬條指令數據微調，具備專業法律問答交互能力

模型能力

法律文本生成

司法判例分析

法律諮詢問答

法律條文解釋

使用案例

司法實踐

數字化案例庫構建

自動處理和分析司法判例文檔

提升案例檢索和分析效率

法律服務

虛擬法律諮詢

提供基礎法律問題解答服務

降低法律諮詢服務門檻

🚀 智海 - 錄問

智海 - 錄問（wisdomInterrogatory）是一款法律大模型，由浙江大學、阿里巴巴達摩院以及華院計算三家單位聯合設計研發。該模型旨在“普法共享和司法效能提升”，為法律智能化體系融入司法實踐、數字化案例建設、虛擬法律諮詢服務賦能等方面提供支持，構建數字化和智能化的司法基座。

🚀 快速開始

智海 - 錄問是專為法律領域打造的大模型。下面將為你介紹其訓練過程以及推理代碼的使用方法。

✨ 主要特性

跨單位合作研發：由浙江大學、阿里巴巴達摩院以及華院計算三家單位共同設計研發。
目標明確：以“普法共享和司法效能提升”為目標，提供多方面支持，形成司法基座能力。
分階段訓練：基於[Baichuan - 7B](https://github.com/baichuan - inc/baichuan - 7B)進行二次預訓練和指令微調訓練。

📦 安裝指南

推理環境安裝

transformers>=4.27.1
accelerate>=0.20.1
torch>=2.0.1
modelscope>=1.8.3
sentencepiece==0.1.99

💻 使用示例

基礎用法

import os
os.environ["CUDA_VISIBLE_DEVICES"] = "0"
from modelscope import AutoModelForCausalLM, AutoTokenizer, snapshot_download
import torch


model_id = "wisdomOcean/wisdomInterrogatory"
revision = 'v1.0.0'
model_dir = snapshot_download(model_id, revision)

def generate_response(prompt: str) -> str:
    inputs = tokenizer(f'</s>Human:{prompt} </s>Assistant: ', return_tensors='pt')
    inputs = inputs.to('cuda')
    pred = model.generate(**inputs, max_new_tokens=800, 
                          repetition_penalty=1.2)
    response = tokenizer.decode(pred.cpu()[0], skip_special_tokens=True)
    return response.split("Assistant: ")[1]

tokenizer = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_dir, device_map="auto", 
                                             torch_dtype=torch.float16,
                                             trust_remote_code=True)
prompt = "如果喝了兩斤白酒後開車，會有什麼後果？"
resp = generate_response(prompt)
print(resp)