世界讯息：大模型中的「罗翔老师」！北大兔展联合团队搞出 ChatLaw，发布即登顶热榜，可提供法律咨询

大模型中的 " 罗翔老师 "，出现了！

【资料图】

北大团队打造的法律大模型 ChatLaw，发布即冲上知乎热搜第一。

它具备大模型能力和充足法律知识，能给法律小白们答疑解惑、提供法律建议。

比如针对网络热议事件，它能给出应该参考的法条，并针对具体案例进行分析：

还可以生成专业的法律文书：仿佛就像是在和真人律师对话。

如果它察觉到人类需要寻求人工服务时，还会推荐相应的法律援助中心。

同时 ChatLaw 也能成为专业律师们的小助手，帮他们处理繁琐的基础工作。这就是北京大学深圳研究生院 - 兔展智能 AIGC 联合实验室（主任：北大田永鸿教授）带来的最新工作。

他们在通用大模型基础上，使用大量法律领域结构化文本数据进行训练，并找来资深律师辅助人工标注、进行高质量事实型多轮对话，最后炼成了 ChatLaw。

与此同时还开源了 3 个模型：ChatLaw-13B、ChatLaw-33B 和 ChatLaw-TextVec。

效果到底如何？我们已经拿到内测资格实际体验了 ~

而且和主创团队问了问 ChatLaw 背后更多细节。

大模型中的 " 罗翔老师 "

进入主页后，可以发现 ChatLaw 提供对话、写作、知识库三种模式。

以对话模式为例，又可分为普通类和专业类。对话模型包括快速、均衡和详细三种，可以按照自己的需要来做选择。然后就可以用最普通的大白话，来向 ChatLaw 描述自己的遭遇了。

和常见的通用大模型不同，ChatLaw 不是一上来就回答问题，而是会先引导你补充更多详细信息。

这也符合一般法律咨询的情况，当事人往往很难一次性提供全面的信息，很多表述都不明确。

在得到补充信息后，它就能做出相应的分析了。当然 ChatLaw 还能处理更加复杂的情况，比如从文件中抽取关键信息做出分析。

在下面的场景中，当事人描述了自己突然被公司强制解雇的情况，ChatLaw 简单分析后认为，这可能存在劳务纠纷，为了能更准确提供建议，它需要当事人提供劳动合同以及解雇通知等。

可以看到 ChatLaw 是支持上传文件的。

在拿到对应后，它将信息总结成了一个清晰的树状图，并将事实用法律语言进行描述，和当事人确认情况。而且 ChatLaw 也能处理多模态信息，比如读取录音文件。更进一步还可以生成法律文书。而且不光是给普通人提供法律咨询服务，ChatLaw 还能充当专业律师的助手。

比如可以基于上下文批量生成文书。

所以，ChatLaw 是如何实现如上效果的？

先验知识约束 + 模型调度

在构成上，ChatLaw 是由1 个调度模型和 3 个子模型组成。

这使得它能更加专业地解决具体问题。

主要创新性工作有两方面：

先验知识约束

模型调度

这两方面工作可以有效降低模型幻觉，并让它能更加灵活智能地解决问题。

先来看先验知识约束方面。

研究团队认为，对于一个垂直领域大模型而言，需要既专业又准确。

尤其是法律这种严肃的行业，一定要尽可能降低模型回答的错误率。

但对于通用大模型来说，训练数据集中往往没有包含非常充足的专业法律知识。比如 ChatGPT 显然是没有拿国内法条训练过的，乱回答的现象非常严重。

这也就是常说的 " 模型幻觉 " 问题。

想要避免就需要进行大量的专业知识训练，即先验知识约束。

在这方面，研究团队使用大量判例文书、法律法规和司法解释，建立了一个大规模知识库。

同时和北大国际法学院、行业知名律师事务所合作，确保数据专业性。

然后在训练阶段将这些法律数据注入大模型中，专门建立一个微调子模型，可以进行关键词检索，来改善单纯依赖矢量数据库检索时不准确的问题。

同时在推理阶段也引入多个模块，将通识模型、专业模型和知识库融为一体，在推理中进行约束，以保证 ChatLaw 生成正确的法律建议，尽可能减少模型幻觉。

具体模型架构如下：

目前这一方法也同步在 arXiv 上发表。据了解，团队还特地整理了过去十年的法考考试题，建立了一个包含 2000 个问题的司法考试测试集。

通过 ELO 机制进行检验，ChatLaw 模型在测试集上成功击败 GPT4，获得最高分。

同时也论证了在专业领域，百亿参数量的模型可以保持卓越的准确性。

而在实际应用场景中，仅仅有强大的专业能力还不够，还需要能够灵活应对各种提问。

在这方面，ChatLaw 提出了一个 "调度模型" 的概念。

研究团队使用针对性微调训练了一个专用调度模型，它能够对问题进行分析，然后对子模型和插件进行调度重组，最终呈现出多个模态的输入和输出。

这样一来，ChatLaw 就能将文件、音频、文字整合在一起分析，同时支持法律文书、思维导图等输出，还能推荐专业的法律援助。

值得一提的是，除了发布 ChatLaw，团队还一并开源了三个模型。

ChatLaw-13B，此版本为学术 demo 版，基于姜子牙 Ziya-LLaMA-13B-v1 训练而来，中文各项表现很好，但是逻辑复杂的法律问答效果不佳，需要用更大参数的模型来解决。

ChatLaw-33B，此版本为学术 demo 版，基于 Anima-33B 训练而来，逻辑推理能力大幅提升，但是因为 Anima 的中文语料过少，导致问答时常会出现英文数据。

ChatLaw-Text2Vec，使用 93w 条判决案例做成的数据集基于 BERT 训练了一个相似度匹配模型，可将用户提问信息和对应的法条相匹配，例如：

" 请问如果借款没还怎么办？"

" 合同法 ( 1999-03-15 ) : 第二百零六条借款人应当按照约定的期限返还借款。对借款期限没有约定或者约定不明确，依照本法第六十一条的规定仍不能确定的，借款人可以随时返还；贷款人可以催告借款人在合理期限内返还。"

两段文本的相似度计算为 0.9960.

在官方展示的测试中，ChatLaw 还可以具备联网能力，效果可以更好。

不过由于目前服务器资源不足，暂时关闭了法条检索模块。

以及在用户隐私保护方面，ChatLaw 会对上传的文件数据进行脱敏处理。

和 ChatExcel 团队师出同门

不过为啥研究团队想要做一个法律领域的专业大模型呢？

这就还得从一家跑路的雅思机构说起了……

主创团队小哥表示，2018 年他报名的雅思课，才开课一星期机构就卷钱跑路了。他想要通过法律途径维权，结果发现这还真不是一件容易的事：

请一个律师至少要 3000 块，包括法律咨询、写诉讼状等……成本太高了。

但普通人自己来搞定这些，又确实很难。比如需要使用 " 法言法语 " 描述问题等……

结合今年的趋势他就想到，能不能让大模型来给普通人提供法律咨询服务。

毕竟大数据也显示，2022 年，全国法院共受理案件 3372.3 万件，其中由律师办理诉讼案件仅有 824.4 万件。74% 的案件没有律师参与，当事人只能自己写材料、诉讼、协商。

而且主创团队还从专业法律人士方面了解到，律师们也很希望有一个 AI 工具能够帮自己提升工作效率，辅助完成一些基本工作。

（工作发表后马上有专业人士留言希望 AI 能提供更强大的功能）

ChatLaw 的幕后团队是北京大学深圳研究生学院 - 兔展智能 AIGC 联合实验室。

值得一提的是，他们和之前爆火过的ChatExcel 团队师出同门。

都是来自北京大学信息工程学院袁粒老师课题组。

袁粒是北京大学信息工程学院助理教授、博士生导师。

团队主创成员有三位，分别是课题组内的准博士生伯华、家熙，以及研究生晏阳。

此外他们也联合了北京大学国际法学院、阿尔法律师事务所提供法律专业建议和指导。

对于法律领域大模型，团队表示他们认为这在国内有着巨大的发展空间。

只有中国，拥有如此巨大规模的人口，统一的法律服务市场，规范的法律判例。

因此，我们坚定的向这个项目投入算力、资源、人力。也许我们的产品现在还有诸多未完善的地方，但技术的发展是非线性的。也许在未来某个时间点，我们能够超越 GPT，为这片土地的普通人带来普惠的法律服务。

据了解，目前 ChatLaw 已经有一些落地合作，而法律领域还只是北大 - 兔展智能 AIGC 实验室的第一步。

未来两个月内，他们预计会陆续推出政务、金融等领域的大模型。

并且已经有了商业计划，" 想做中国版 Cohere"。专注于企业服务。基于法律、政务、金融 3 个领域，不断完善行业级大模型。

但同时这些能力也会继续向普通人开放。

感兴趣的童鞋，可戳下方体验链接申请内测 ~

官方地址：https://www.chatlaw.cloud/?

GitHub 地址：

https://github.com/PKU-YuanGroup/ChatLaw

论文地址：

https://arxiv.org/abs/2306.16092

世界讯息：大模型中的「罗翔老师」！北大兔展联合团队搞出 ChatLaw，发布即登顶热榜，可提供法律咨询

每日热门：织密园区党组织网络，华泾镇举办企业游园会

消息称 iPhone 15/15 Plus 新增“青绿色”

天天时讯：广州铭睿工程设计有限公司_广州中睿设计院在哪里

河中感怀寄诸兄

温网开门黑！中国金花神奇纪录终结，不敌世界第1，换帅后3连败！

化工污水处理器设备

高温安全知识帖！面对“烤”验，这些物品也要防暑降温 每日快报

2023安徽滁州来安县部分学校选调教师笔试成绩的通知

【动物界全系列】真虾下目—匙指虾科

圣泉集团：7月3日融券净卖出9806股，连续3日累计净卖出4.83万股-天天简讯

6月份中国物流业景气指数保持向好态势

【独家】旅游业进入全面复苏新通道 “避暑、研学、康养”将领跑暑期游市场

世界快看：嘉祥县嘉祥街道兖兰社区开展“笔墨绘初心”书法活动

7月3日基金净值：交银经济新动力混合A最新净值2.8112，涨1.22%

一线调研看新局 | 先进制造龙头争相落子 郑州航空港崛起智能产业高地_当前信息

焦点要闻：天津银行（01578.HK）7月3日收盘跌3.35%

仅有四成受访者觉得好用，人民日报：智能客服要真服务

【聚看点】海贼王基德摄影（海贼王基德）

每日头条!纽约股市三大股指3日上涨

铜雀台影视剧情 电影铜雀台没有小鲜肉 焦点热议

光遇9月2日复刻先祖在哪 9月2日复刻先祖在哪里介绍

【全球时快讯】海南新增7所普通高中招生学校 计划招生2052人

天天新动态：新赛股份（600540）每日收评（07-03）

中超：阿齐兹帽子戏法＆阿奇姆彭破门，三镇3比1逆转深足迎近五轮首胜

环球速看：上海艾录：6月30日公司高管陈曙减持公司股份合计10万股

福建省漳州市2023-06-23 22:30发布雷电黄色预警 环球热点

英格尔2022年年度权益分派实施方案为：每10股送红股18.408968股派9.204484元

望江南·过瓜洲渡_对于望江南·过瓜洲渡简单介绍

【全球时快讯】开创电气(301448.SZ)副总经理王寿江配偶买卖股票致短线交易

失恋伤感个性签名 失恋伤感个性签名女

俄驻联合国官员：黑海港口农产品外运协议延期条件未达到

全球速读：在地球上 我们也有了“空间站”！全球首创

全球视点！广宇集团为控股子公司一石巨鑫1.5亿元综合授信提供担保

梦见拾砖头_周公解梦梦见捡砖头 这是好兆头吗

驾驶证审证过期了怎么办 全球热点评

Nvidia 表示 RTX 4060 比没有 DLSS 的 RTX 3060 快 20%

云天化：公司目前甲醇产能26万吨/年 甲醇部分外售 部分用于下游生产聚甲醛

北京市检察院：去年全市检察机关共起诉电信网络诈骗及关联犯罪1179人

郑州丹尼斯社会招聘简章 天天速讯

抖音直播唱歌怎么赚钱？有哪些技巧？

环球即时看！大理风花雪月什么意思

天天简讯:东莞社保缴费基数是多少钱一个月 2023东莞个人社保缴费标准表

上半年融资余额增加509.9亿元 四大行业获净买入超百亿元_全球快看点

天天热消息：李泉草帽歌蒙面歌王完整版_李泉

国内最大规模超高压跨江输变电工程投运|世界新要闻

蹦床世界杯圣塔伦站结束 严浪宇朱雪莹强势问鼎-焦点热议

2023重庆汉海鲸豚湾水世界有哪些项目？

中物联：2023年6月份中国物流业景气指数为51.7%

线上引流方法有哪些_引流方法有哪些-环球短讯

世界时讯：东方锆业（002167）6月30日主力资金净买入184.54万元

保时捷计划设计一款电动Macan，与目前的汽油动力车型并驾齐驱_世界资讯

“木头姐”在特斯拉公布交付数据前又抛售近1900万美元股票 全球最新

聚焦：新股消息 | 元续科技递表港交所 公司提供全面的一站式精密工程服务

专利如何查 专利一般应该怎么查询

济南市德康学校 关于济南市德康学校简介 世界快播

每日快报!央企五千亿投资助力东北国企改革

【桃文／甜向／短篇】当空向宵宫求婚

舞蹈史诗《黄河》登陆北京

汽车知识解答p2004故障码怎么解决？ 天天观天下

从概率论与数理统计改考数据结构与算法！江苏大学计算机考研改考

全球速讯：格陵兰鲨（格兰陵）

天天观点：最廉价的5.1家庭影院系统解决方案

环球今头条！超1300亿元！海南离岛免税新政策实施三年成绩亮眼

菊花是酸性还是碱性（菊花茶的功效与作用）

和女朋友约会应该找什么话题_和女朋友约会怎么安排|环球今热点

1.2升车动力怎样？加速性能、燃油经济性详解！_全球热点评

反转，内马尔协议遭拆穿！难怪姆总嫌弃他，女友妹妹：你不知羞耻

产业发展全体会议 | 嘉宾阵容一图速览！20+行业大咖邀您共话大模型浪潮下的产业新未来

每日速看!业界：加强同业交流 提高反洗钱监测分析和调查协查实效

快看点丨2023年“中国侨都•红线女粤剧艺术周”启动 新编粤剧《碉楼》羊城首演

深入学习贯彻中共中央政治局会议精神 以高度的政治责任感办好千年大计国家大事

当前观点：山西省消防安全“两个排查整治”第五督导组在吕梁开展专项督导检查工作

如何寻觅百倍牛股？做到这两点

建行邹平支行：拒绝假币，净化人民币流通环境|每日视点

每日消息!天空：吉达联合和凯尔特人边锋若塔深入谈判，转会费约2500万镑

【天天热闻】全省率先建成！宿迁市公安融媒体中心正式启动

环球观焦点：水准仪读数是什么意思_水准仪读数图解

姐姐的守护者结局（姐姐的守护者）

鲁迅讨厌吃干菜？探绍兴风味 世界短讯

高温安全知识帖！面对“烤”验，这些物品也要防暑降温每日快报

一线调研看新局 | 先进制造龙头争相落子郑州航空港崛起智能产业高地_当前信息

铜雀台影视剧情电影铜雀台没有小鲜肉焦点热议

【全球时快讯】海南新增7所普通高中招生学校计划招生2052人

福建省漳州市2023-06-23 22:30发布雷电黄色预警环球热点

失恋伤感个性签名失恋伤感个性签名女

全球速读：在地球上我们也有了“空间站”！全球首创

梦见拾砖头_周公解梦梦见捡砖头这是好兆头吗

驾驶证审证过期了怎么办全球热点评

云天化：公司目前甲醇产能26万吨/年甲醇部分外售部分用于下游生产聚甲醛

郑州丹尼斯社会招聘简章天天速讯

上半年融资余额增加509.9亿元四大行业获净买入超百亿元_全球快看点

蹦床世界杯圣塔伦站结束严浪宇朱雪莹强势问鼎-焦点热议

“木头姐”在特斯拉公布交付数据前又抛售近1900万美元股票全球最新

聚焦：新股消息 | 元续科技递表港交所公司提供全面的一站式精密工程服务

专利如何查专利一般应该怎么查询

济南市德康学校关于济南市德康学校简介世界快播

汽车知识解答p2004故障码怎么解决？天天观天下

每日速看!业界：加强同业交流提高反洗钱监测分析和调查协查实效

快看点丨2023年“中国侨都•红线女粤剧艺术周”启动新编粤剧《碉楼》羊城首演

深入学习贯彻中共中央政治局会议精神以高度的政治责任感办好千年大计国家大事

鲁迅讨厌吃干菜？探绍兴风味世界短讯

V观财报｜周大生：董事亲属短线交易公司股票，获利850元-环球通讯

央行：延续实施普惠小微贷款支持工具和保交楼贷款支持计划全球热文