通知公告
当前位置: 首页->首页推荐->通知公告->正文

关于第二届大学生数据法治实验模型竞赛暨学生项目申报工作的通知

时间:2024年06月14日 10:11    来源:    作者:admin    阅读:

教育部哲学社会科学实验室

中国政法大学数据法治实验室

中国政法大学数据法治研究院

数字检察研究基地

《关于开展第二届大学生数据法治实验模型竞赛

暨学生项目申报工作的通知》


大学生数据法治实验模型竞赛比赛背景

随着数字技术的蓬勃发展和广泛运用,法学研究对象和范式正在进入新的时代。为了促进数据与数字技术在中国法学研究的应用,加快构建数据法学知识体系,解决影响数字中国建设的重大法学理论和法治实践问题,培养高素质的数据法学人才,教育部哲学社会科学实验室中国政法大学数据法治实验室、中国政法大学数据法治研究院、数字检察研究基地从2023年起开始设立大学生数据法治实验模型竞赛。


01 指导思想

竞赛以服务数字中国和法治中国建设为基本目标,秉承公开公平、鼓励创新、选拔人才的办赛理念,聚焦数字中国建设对数据法学和数据法治的需求,突出数据和数字技术在法治领域的实验应用,搭建大学生展示数据法治实验创新能力、推动产学研深度融合的竞赛平台。


02 参赛报名要求

1.欢迎各高校有志于构建数据法治实验模型的各专业在校大学生自组团队申报。

2.参赛者有能力将有一定法学理论意义或者实践价值的问题转化为可以通过数据处理或协助处理的问题,并且能够通过新建或者优化模型、运用现有数字技术、处理相关数据加以解决。

3.2024615日起,开始受理项目申报。申请人可登录中国政法大学数据法治研究院网站或者本推送附件链接下载《申请评审书》,按《申请评审书》的填表要求填写,并通过邮箱发送《申请评审书》电子文档。

4.报名需要提供申请人的个人身份证明以及所在学校的书面证明。

5.项目进入决赛阶段的团队,可直接获得中国政法大学教育部数据法治实验室学生项目资助。决赛获奖团队的主要成员同等条件下可获得中国政法大学数据法治研究院2025年研究生推免复试优先资格。


03 赛事安排

竞赛组委会负责竞赛的组织实施。组委会办公室设在中国政法大学数据法治研究院,负责竞赛各项工作具体执行。竞赛由初赛与决赛组成。

(一)报名。提交《申请评审书》。

(二)初赛。提交作品,经过专家评审后的队伍进入决赛。

(三)决赛。由竞赛组委会办公室负责牵头组织,拟采用线下方式进行,举办地点和时间另行通知。


04 参赛题目

参赛队伍可以从下面的三道题中任选一道题参赛。

赛道一:知识图谱赛道

基于知识图谱,从海量法律文本数据(如法律裁判文书)中提取关键信息、建立案件之间的关联,进行智能化的法律分析和决策。具体要求如下:

文本数据抽取:从法律裁判文书中提取结构化的数据,包括案件名称、当事人信息、法院名称、审判程序、法律条款引用等关键信息。

实体识别与关系抽取:利用自然语言处理技术,对文本进行实体识别,识别出案件名称、当事人、法院等实体,并提取它们之间的关系,如当事人之间的关系、案件与法律条款的关联等。

知识图谱构建:基于提取的实体和关系数据,构建法律裁判文书的知识图谱,其中案件、当事人、法律条款等为节点,它们之间的关系为边,形成一个结构化的图谱表示。

法律条款解析:对文书中引用的法律条款进行解析和归类,将其与法律知识图谱中的实体和关系进行关联,以便在知识图谱中呈现法律条款的适用情况和相关案例。

可视化展示与查询:利用大数据可视化技术,将构建的法律裁判文书知识图谱进行可视化展示,为用户提供直观的案件信息和法律关联。提供基于知识图谱的查询接口,允许用户通过图形界面或查询语言对法律裁判文书进行检索和分析。

智能分析与推理:基于知识图谱的结构和内容,实现法律条款的解释和适用、类似案件的推荐、法律风险评估等智能化分析功能。

通过以上步骤,可以利用知识图谱处理法律裁判文书,实现从文本数据到结构化知识图谱的转换,为法律工作者提供全面的案件信息管理和智能化的法律分析功能。


赛道二:文本挖掘赛道

利用文本挖掘技术对法律文本进行分析,可参考如下要求(不要求全部实现):

数据收集与清洗:收集海量法律裁判文书数据,并进行清洗,包括去除HTML标签、特殊字符、停用词等,以保证大数据的质量。

分词与词性标注:将文本进行分词,并对每个词语进行词性标注,以便后续的语义分析。

实体识别与命名实体识别:使用命名实体识别技术,识别文本中的实体,如人名、组织机构名、地名等,以及法律相关的特定实体,如法律条款、法院名称等。

关键信息抽取:提取文本中的关键信息,如案件名称、案由、当事人信息、法院名称、判决结果等,以建立案件的关键信息库。

主题建模:使用主题建模技术(如pLSALDA等)对文本进行主题分析,发现文档中隐藏的主题结构,帮助理解文书的内容和关联。

情感分析:对文本进行情感分析,了解文书中的情感倾向,包括对当事人的态度、法官的意见等,以帮助评估案件的特征和趋势。

相似案例检索:基于文本相似度计算,检索出与当前案件类似的先前判例,为法律专业人士提供类似案例的参考。

法律条款解析:对文书中引用的法律条款进行解析和归类,以建立法律条款的知识库,并与案件信息进行关联。

可视化与查询:使用数据可视化技术,将文本挖掘的结果以图表、图谱等形式进行展示,帮助用户直观地理解和分析文书数据。提供查询接口,支持用户根据关键词、案件类型等条件检索文书,并进行深入分析。


赛道三:大模型赛道

利用预训练模型对法律文本进行分析,可参考如下要求(不要求全部实现):

数据预处理:对海量法律裁判文书进行数据清洗和格式化,包括去除特殊字符、标点符号等,确保文本数据的质量和一致性。

特征提取:利用大型预训练语言模型(如GPT-4BERT等)来提取文本特征,以捕获文本中的语义和语境信息。

命名实体识别:使用预训练模型进行命名实体识别,以识别文本中的实体信息,如案件名称、当事人、法院、日期等。

关键信息抽取:利用预训练模型进行关键信息抽取,以提取案件类型、判决结果、相关事实描述等关键信息。

主题建模:使用预训练模型进行主题建模,以发现文档中的主题结构,帮助理解文书的内容和关联。

情感分析:基于大型预训练语言模型进行情感分析,了解文书中的情感倾向,包括对当事人、法官的态度等。

相似案例检索:基于文本相似度计算,利用大型预训练语言模型来检索与当前案件类似的先前判例,为法律专业人士提供参考。

法律条款解析:使用预训练模型进行法律条款解析和归类,以建立法律条款的知识库,并与案件信息进行关联。

可视化与交互:利用大型预训练语言模型得到的结果进行数据可视化,支持用户交互式查询和分析。

以上题目不限定数据集,参赛队伍可根据所选题目自行构建数据集,与作品同时提交。


05 作品形式与提交

作品形式:

报告文档、算法模型实现代码和使用数据(打包压缩成一个文件提交,如数据集无法打包,可提供有效的网盘下载链接)

作品提交方式:

上传作品的方式将于后续推送提供,请密切关注公众号最新推送

联系人:刘思远

电子邮箱:dxssjfzsymxjs2024@163.com


时间安排

报名组队:2024615-75

作品提交截止:2024810

决赛入选作品通知:2024820

优秀作品评选与颁奖:2024829—31


奖项设置

一等奖不超过3 荣誉证书+奖金10000/队;

二等奖不超过6 荣誉证书+奖金5000/队;

三等奖不超过9 荣誉证书+奖金3000/队;

优秀作品奖若干名 荣誉证书。


常见问题

Q1:本科生可以和研究生组队参赛吗?

A1:原则上本科生与研究生分开组队,以便区分赛道进行评价。若本科生与研究生组队,该类队伍归入研究生赛道进行评比。但是只有在本科生组获奖的主要参赛成员才可获得推免复试优先资格。


Q2:参赛队伍的成员有专业限制吗?

A2:没有,任何专业的学生都可以参赛。


Q3:参赛队伍是否必须有法学专业学生?

A3:不必须,任何专业的学生都可以参赛。


Q4:可以跨校、跨学院或跨专业组队参赛?

A4:可以。


Q5:一所大学能有多支队伍参赛吗?

A5:可以。


Q6:一个参赛队伍的成员人数有上限吗?

A6:有的,最多6人。


Q7:可以同时参加数支参赛队伍吗?

A7:不可以。


Q8:需要指导老师吗?

A8:指导老师非必需。


Q9:参赛需要的学校证明文件具体是什么?

A9:在《申请评审书》上的第四部分所在学校或院系盖章盖上学校或院系公章即可。若因不可抗因素无法提供盖章评审书,可向竞赛组委会特殊申请后出具参赛队员的在读证明代替。


Q10:参赛需要的个人身份证明具体是什么?

A10:身份证复印件或学生证均可。


Q11:《申请评审表》的截止时间是?

A11:参考竞赛通知上有关报名组队的时间,为202475日。


Q12:需要寄送纸质版《申请评审书》吗?

A12:无需寄送纸质版,发送至竞赛活动指定的电子邮箱:dxssjfzsymxjs2024@163.com

文件建议命名为"负责人名称+项目名称+申请评审书"


Q13:竞赛对使用的软件有具体要求或限制吗?

A13:竞赛对所使用的软件没有限制,但参赛队伍必须保证在评审过程中组委会可以用同样的软件对结果进行重现。


Q14:竞赛需要上传代码及数据吗?

A14:需要,以便在评审时以相关数据和代码对结果进行验证和重现。


Q15:可以申请相关数据只在评审专家内部公开,不对公众公开吗?

A15:原则上相关数据只会在评审专家内部公开。


Q16:请问竞赛的奖项设置是?

A16:将为表现优异的参赛队伍授予荣誉证书和奖金。具体奖项设置为:

一等奖不超过3名,每支参赛队伍获授予荣誉证书和奖金10000元;

二等奖不超过6名,每支参赛队伍获授予荣誉证书和奖金5000元;

三等奖不超过9名,每支参赛队伍获授予荣誉证书和奖金3000元;

优秀作品奖若干名,每支参赛队伍获授予荣誉证书。


Q17:参赛得出的最终成果有成果发表限制吗?

A17:有发表限制,本次竞赛产生的成果及其形成的知识产权,除涉及国家安全、国家利益、重大社会公共利益或合同书有特别约定的外,归中国政法大学数据法治实验室所有,课题负责人及成员享有署名权。获奖参赛作品在成果发表时须标注受教育部哲学社会科学实验室中国政法大学数据法治实验室、中国政法大学数据法治研究院、数字检察研究基地资助字样。


Q18:请有竞赛的通知群吗?

A18:有QQ群,群号为970432373,欢迎加群关注竞赛动态。