智能刑期预测赛 - 琶洲算法大赛

智能刑期预测赛
AI-Based Criminal Judgment Prediction Competition

一、赛题名称

第四届琶洲算法大赛——智能刑期预测赛。

二、承办单位

广州市法学会数字法学研究会、广州数据交易所、佳都科技集团股份有限公司、广东南方福瑞德律师事务所。

三、参赛对象

参赛人员：面向境内外开放，相关领域的个人、科研机构、高等院校、企业、事业单位、政法机关人员等均可报名参加。

四、赛题背景

刑期预测是法律科技领域的核心命题，可应用到刑事辩护、检察公诉、司法审判等多个法律职业的多个应用场景。刑期预测有助于降低主观经验导致的量刑差异，防范任意裁量，促进“类案类判”；有助于让案件当事人对裁判结果有合理预期，促进认罪服法，减少上诉率；有助于提高司法效率、增强司法透明度。

五、比赛任务

在此次比赛中，参赛者应在深刻理解量刑规定及法理的基础上，将量刑规则和司法价值判断融入算法并经大量真实判例学习校准，再预测量刑期限。赛事举办方将提供3～5个罪名的数万份真实案例的刑事判决书作为训练数据集。

六、评测方法

本次比赛以参赛算法的刑期预测精准性、新颖性、可拓展性、优化潜力等为评判标准。精准性方面的评价，将使用平均绝对误差作为主要指标，即预测刑期与真实刑期之差的绝对值的平均值，误差越小越好。新颖性、可拓展性、优化潜力等方面的评价，以参赛队伍书面提交的核心算法原理为主要依据，并在决赛等阶段安排答辩环节。

七、赛制安排

（一）初赛阶段（8月上旬前完成）

案件类别：主要就故意伤害案作刑期预测。

提交方式：报名成功的参赛队伍将在本地调试算法后，在指定时间内，就数百个测试案件预测刑期并在线提交结果，每天可提交2次，系统将实时反馈成绩和排名。

提交要求：参赛团队需提交刑期预测结果,格式为JSON文件，覆盖测试集所有案例，每案例输出需包含刑期预测结论，具体包含字段如下：

[{

"case_id":"xxx",

"predicted_sentence1": 管制，月份数(int),

"predicted_sentence2": 拘役，月份数(int)，

"predicted_sentence3": 有期徒刑，月份数(int),

"predicted_sentence4": 缓刑，月份数(int)，

"predicted_sentence5": 无期徒刑，true or false

"predicted_sentence6": 死刑，true or false

},...]

晋级机制：初赛阶段，初赛排行榜前50%的参赛队伍将晋级复赛（最多晋级50支队伍）。

（二）复赛阶段（9月初前完成）

案件类别：主要就盗窃、诈骗等案件作刑期预测。

模型限制、提交要求、评测流程和评测方法与初赛一致。复赛阶段排名前8名的队伍将晋级决赛答辩环节。组委会将对代码及模型进行审核，审核不通过的队伍将被取消答辩资格，晋级名额将依据复赛排行榜顺延。

（三）决赛答辩阶段（9月中旬前完成）

决赛将以线下或线上答辩形式进行。晋级队伍需准备答辩材料，包括答辩PPT、参赛总结和核心代码。

晋级团队需提交答辩PPT初稿，提交时间将另行通知。组委会将审核并提供修改建议，随后团队需提交终稿。答辩的具体时间和地点将另行通知。

答辩流程包括15分钟的队伍陈述和10分钟的评委问答。评委将根据技术思路、理论深度和答辩表现进行评分。

决赛分数由复赛成绩（占60%）和答辩成绩（占40%）加权得出。主办方将根据决赛分数颁发奖项。

八、技术限制

本赛事不限制参赛选手使用官方训练数据集的方法，包括可将提供的案例用于训练微调或制作为知识库，但需遵守以下规定：

（一）如果借助大语言模型，仅可以使用国内企业开发的开源大模型。

（二）进行模型训练时，训练数据集只能用官方提供的案例作为语料，不能使用其他数据。

（三）使用知识库辅助模型决策时，知识库的语料可以从互联网上收集，但必须是开源或公开的内容，相关语料参赛选手必须可提供链接作为验证。

九、赛事咨询

庞文丰 13434399460