法律检索和分析。大模型可以通过自然语言处理和知识图谱的技术,快速地检索和分析海量的法律文档、案例、判例等,为律师提供相关的法律信息和建议。
法律文档的审阅和生成。大模型可以自动地审阅和生成各种法律文档,如合同、起诉书、判决书等,减少律师的重复性和标准化的工作。
在线法律服务和咨询。大模型可以通过对话系统和语音识别的技术,与客户进行在线的法律交流和咨询,提供一些基础的法律服务和支持。
案件的预测和评估。大模型可以根据历史的案件数据和判决结果,预测和评估案件的可能的胜诉率和风险,为律师制定最佳的诉讼策略。
国内通义千问和讯飞星火大模型都有针对法律的微调大模型,国外CoCounsel是基于GPT-4大模型能力开发的AI法律助手,由美国法律科技公司Casetext研发并运营。CoCounsel以自然语言的交互方式,依靠相当于法律专业研究生的阅读、理解和写作水平,协助律师快速完成原本复杂而耗时的任务。部分法律大模型:
LawGPT-zh:由獬豸团队开发,基于ChatGPT清洗CrimeKgAssitant数据集得到52k单轮问答,以及根据中华人民共和国法律手册上最核心的9k法律条文,利用ChatGPT联想生成具体的情景问答和知识问答。
LaWGPT:由清华大学计算机系开发,基于ChatGLM-6B架构,通过在法律领域的数据集上进行微调,增强了大模型在法律领域的基础语义理解能力,并构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,提升了模型对法律内容的理解和执行能力。
Lawyer LLaMA:由北大团队开发,首先在大规模法律语料上进行了continual pretraining,让它系统学习中国的法律知识体系,然后借助ChatGPT收集了一批对中国国家统一法律职业资格考试客观题的分析和对法律咨询的回答,利用收集到的数据对模型进行指令微调,让模型习得将法律知识应用到具体场景中的能力。
LexiLaw:由Simon团队开发,基于ChatGLM-6B架构,通过在法律领域的数据集上进行微调,使其在提供法律咨询和支持方面具备更高的性能和专业性。
DISC-LawLLM,网址:DISC-LawLLM (fudan-disc.com)可直接免费试用Demo。由复旦大学团队发布,中文智慧法律系统DISC-LawLLM,构建司法评测基准,开源30万微调数据。一个面向智慧司法系统的领域大模型,能够为用户提供专业、智能、全面的法律服务,开启对话,让它成为私人法律助手。法律咨询,模拟律师提供法律援助,解决法律事务问题,法律释疑;律师助理,法律检索,要点提取,案件分析;法考助手,帮助解答法律考题,提供答案与解析,基础概念辨析。其他详情见网址介绍页面。
通义法睿,网址:通义法睿目前免费开放测试中,注册登录后填写基本信息即可试用。基于阿里通义大模型2.0。法律智能对话:通过问题理解,正确引用法规和案例进行问题回答。法律文书生成:根据案情描述,自动总结法律诉求并撰写法律文书。法律知识检索:提供法律法规、类案检索,自带法律法规和裁判案例库。法律文本阅读:基于阅读需求,提炼生成案情摘要还能归纳争议焦点。
Chatlaw,网址:Chatlaw (chatlaw.cloud)目前需申请内测使用,申请一般都能过。深圳市南山区北京大学深圳研究生院。支持对关键事实进行归纳梳理,生成导图、图表,可视化分析。法律知识注入,自研先验知识约束算法,基于亿级法律领域结构化语料及专业化人工标注进行模型知识注入,确保生成内容无误,避免大模型幻觉问题。自动化写作,写作模型基于百万级法律文书语料进行微调,一键精准归纳用户事实,自动化进行法律文书写作。其他详情见网址介绍页面。
LexiLaw,介绍原文:LexiLaw-中文法律大模型,开源项目网址:GitHub - LexiLaw,免费开源,但需自行部署使用。中文法律大模型。清华大学计算机系。基于 ChatGLM-6B 架构,通过在法律领域的数据集上进行微调,使其在提供法律咨询和支持方面具备更高的性能和专业性。
总体来讲,国内大模型的商业化落地效果都不好,商业化比较成功的是国外的CoCounsel,他们已经走通了商业模式:根据客户使用的技能数量和委托给AI的工作量,提供按次付费和订阅付费服务,并且为独立律师、小型律所、大型律所和公司内部律师提供不同的计划。由于法律行业的人力成本较高,单用户订阅付费区间设定为100~500美元/月。以订阅付费模式为主的商业模式,能产生持续的收入流,通过优质体验保证续费率,并持续扩大业务规模。
法律数据的质量和数量不足。法律领域的数据往往是专业的、复杂的、动态的,需要大量的人工整理和标注,以保证数据的准确性和时效性。此外,法律数据的获取和共享也存在一定的难度和限制,导致数据的覆盖度和多样性不足。
法律知识的结构化和表示不充分。法律知识是由法律条文、司法解释、案例判例等多种形式构成的,它们之间存在着复杂的逻辑关系和推理规则。如何将这些法律知识有效地结构化和表示,以便于大模型的学习和应用,是一个挑战性的问题。
法律场景的多样性和专业性较高。法律领域涉及到各种不同的场景和任务,如合同分析、证据链构建、裁判文书生成等,它们对大模型的能力和性能都有不同的要求和期望。如何让大模型能够适应不同的场景和任务,以及如何评估和监督大模型的表现,是一个实践性的问题。
所以,如果是律师个人使用大模型来进行提效,那么现有没有经过微调的大模型最大的问题是幻觉问题,作为严谨法律专业,是不允许的。那么经过微调训练的专业大模型或多或少还存在有效数据不足的问题,大量的非结构化数据需要进行归一化,变成结构化数据的表示,变成大模型可以使用的向量数据库形式,需要有专业公司来做。另外一个就是长期记忆的问题,最好的大模型应用形式是打造一个律师专用的智能助手,可以帮助律师整理和输出法律文档,代替律师进行服务客户,替代助理律师的部分职责。
为了获得OpenAI公司的优先支持,Casetext公司为CoCounsel建立了一个完善的、增强大模型信任度和可靠性的计划,以克服大模型可能出现的“幻觉”问题。首先,专业的AI工程师和律师团队花费近4000小时,基于3万多个法律问题,对模型进行训练和微调。然后,Casetext公司组织了庞大的Beta测试小组,测试人员由来自全球律师事务所、企业内部法律部门和法律援助组织的400多名律师组成。Casetext公司要求测试小组在日常工作中使用CoCounsel至少50000次,并提供详细的反馈,以此作为模型和应用优化的依据。
所以你看,这些活还得律师来干,不过可能最终会抢了部分初级律师的饭碗。不过优秀的律师不用担心,因为AI没有办法最终负责。承担责任的还得是人类,另外创造性的进行案情分析,并最终帮客户打赢官司,得是优秀的有创造性的律师。
当然,我们具备从私有大模型部署到私域数据归一化、数据微调、使用Agent来完成业务链应用,对接常用系统的全部能力,已经在部分行业有了落地的案例,有想合作的独立律师、律所可以联系啊。