AI-Based Criminal Judgment Prediction Competition
一、赛题名称
第四届琶洲算法大赛——智能刑期预测赛。
二、承办单位
广州市法学会数字法学研究会、广州数据交易所、佳都科技集团股份有限公司、广东南方福瑞德律师事务所。
三、参赛对象
参赛人员:面向境内外开放,相关领域的个人、科研机构、高等院校、企业、事业单位、政法机关人员等均可报名参加。
四、赛题背景
刑期预测是法律科技领域的核心命题,可应用到刑事辩护、检察公诉、司法审判等多个法律职业的多个应用场景。刑期预测有助于降低主观经验导致的量刑差异,防范任意裁量,促进“类案类判”;有助于让案件当事人对裁判结果有合理预期,促进认罪服法,减少上诉率;有助于提高司法效率、增强司法透明度。
五、比赛任务
在此次比赛中,参赛者应在深刻理解量刑规定及法理的基础上,将量刑规则和司法价值判断融入算法并经大量真实判例学习校准,再预测量刑期限。赛事举办方将提供3~5个罪名的数万份真实案例的刑事判决书作为训练数据集。
六、评测方法
本次比赛以参赛算法的刑期预测精准性、新颖性、可拓展性、优化潜力等为评判标准。精准性方面的评价,将使用平均绝对误差作为主要指标,即预测刑期与真实刑期之差的绝对值的平均值,误差越小越好。新颖性、可拓展性、优化潜力等方面的评价,以参赛队伍书面提交的核心算法原理为主要依据,并在决赛等阶段安排答辩环节。
七、赛制安排
(一)初赛阶段(8月上旬前完成)
案件类别:主要就故意伤害案作刑期预测。
提交方式:报名成功的参赛队伍将在本地调试算法后,在指定时间内,就数百个测试案件预测刑期并在线提交结果,每天可提交2次,系统将实时反馈成绩和排名。
提交要求:参赛团队需提交刑期预测结果,格式为JSON文件,覆盖测试集所有案例,每案例输出需包含刑期预测结论,具体包含字段如下:
[{
"case_id":"xxx",
"predicted_sentence1": 管制,月份数(int),
"predicted_sentence2": 拘役,月份数(int),
"predicted_sentence3": 有期徒刑,月份数(int),
"predicted_sentence4": 缓刑,月份数(int),
"predicted_sentence5": 无期徒刑,true or false
"predicted_sentence6": 死刑,true or false
},...]
晋级机制:初赛阶段,初赛排行榜前50%的参赛队伍将晋级复赛(最多晋级50支队伍)。
(二)复赛阶段(9月初前完成)
案件类别:主要就盗窃、诈骗等案件作刑期预测。
模型限制、提交要求、评测流程和评测方法与初赛一致。复赛阶段排名前8名的队伍将晋级决赛答辩环节。组委会将对代码及模型进行审核,审核不通过的队伍将被取消答辩资格,晋级名额将依据复赛排行榜顺延。
(三)决赛答辩阶段(9月中旬前完成)
决赛将以线下或线上答辩形式进行。晋级队伍需准备答辩材料,包括答辩PPT、参赛总结和核心代码。
晋级团队需提交答辩PPT初稿,提交时间将另行通知。组委会将审核并提供修改建议,随后团队需提交终稿。答辩的具体时间和地点将另行通知。
答辩流程包括15分钟的队伍陈述和10分钟的评委问答。评委将根据技术思路、理论深度和答辩表现进行评分。
决赛分数由复赛成绩(占60%)和答辩成绩(占40%)加权得出。主办方将根据决赛分数颁发奖项。
八、技术限制
本赛事不限制参赛选手使用官方训练数据集的方法,包括可将提供的案例用于训练微调或制作为知识库,但需遵守以下规定:
(一)如果借助大语言模型,仅可以使用国内企业开发的开源大模型。
(二)进行模型训练时,训练数据集只能用官方提供的案例作为语料,不能使用其他数据。
(三)使用知识库辅助模型决策时,知识库的语料可以从互联网上收集,但必须是开源或公开的内容,相关语料参赛选手必须可提供链接作为验证。
九、赛事咨询
庞文丰 13434399460