线上数据运营是做什么的,美团数据运营是做什么的?

线上数据运营是做什么的,美团数据运营是做什么的?线上数据运营是做什么的,美团数据运营是做什么的?

余聪

上海市虹口区人民法院法官助理

线上数据运营是做什么的,美团数据运营是做什么的?线上数据运营是做什么的,美团数据运营是做什么的?

要目

引言

一、短板检视:审判态势数据分析面临的智能信息化挑战

二、成因溯源:审判态势数据分析深度挖掘与应用的制约因素

三、建构基础:DQM数据质量管理在审判态势数据分析中的演绎

四、跃迁之道:审判态势数据分析运营部门的实践路径

结语

线上数据运营是做什么的,美团数据运营是做什么的?

人民法院信息化建设已步入“以知识为中心”的4.0时代,然而法院在司法活动中获集的海量数据并没有发挥出等量价值。通过对法院审判运行态势的分析,短板在于数据分析多头离散、重管理而轻用户导向、潜藏数据安全与隐患、反哺成果转化率不足等,其制约因素在于排名倾向导致理解偏差、技术壁垒增加“剪刀差效应”、数据多源异构难建专业运营体系。因此,有必要将法院获取的公共数据资源作为类似矿产等自然资源进行专有管理,设置专门的数据运营部门。再辅之以DQM数据质量管理为视角,分别从数据稽核、数据处理、数据服务、数据应用方面进行流程演绎,从运营原则、人员配置、工作流程、系统功能实现等方面为设置专门数据运营部门提供发展路径指引。

线上数据运营是做什么的,美团数据运营是做什么的?

引言

审判运行态势分析是从海量案件信息中提炼出能够反映国家经济社会发展的“风向标”“晴雨表”。进入大数据、人工智能、区块链、5G时代后,信息化的核心技术不断迭代升级,智慧法院的内涵和外延必然扩展到新的广度和深度。人民法院的信息化建设已经从互联互通为主要特征的2.0版发展到以数据为中心的3.0版,再到如今的“在2022年底基本建成、2025年底全面建成以知识为中心的信息化4.0版”,推动大数据在司法领域的应用是我国司法改革的现实需求。科技与司法的深度融合,始终与时代潮流同频共振,如何让二者相辅相成、有机协作,成为当前人民法院面临的一项重要课题。

一、短板检视:审判态势数据分析面临的智能信息化挑战

审判态势分析作为审判管理的基本职能之一,对于掌握审判领域发展动态、法院领导制定决策具有重要参考作用。定期开展审判态势分析,一方面有助于统计分析人员提升信息采集质量,也有助于审判管理层有的放矢的制定相关管理政策和内容,及时调整管理策略,同时有助于国家从整体观、大局观进行分析,为国家制定政策提供参考。按照“十四五”期间工作布局和整体思路,未来人民法院信息化建设应着力构建中国特色、引领世界互联网司法创新潮流,提升服务经济社会发展的能力和水平,实现更高水平的数字正义。

数据分析多头离散,反增二次化处理负担

在智慧法院建设的逐步推进下,全国各地法院不断呈现出统一性和多样性并存的局面,符合地方需求特色的微创新层出不穷,却也导致原有法标体系对司法数据的覆盖率严重不足,各业务条线系统之间相互割裂的问题在数据分析方面体现尤为明显。各部门由于职权各异,相应研发不同的数据平台,定期发布各自的数据分析报告,导致多部门统计数据并存。由于数据采集系统端口各有差异,获取数据的自动化程度和时效性不同,也存在不同的数据生成方式(如图1)。同一数据在不同系统中名称字段不同,结果统计亦不同,数据准确性和一致性无法保障,为司法数据的使用带来极大困难。此外,虽然通过自动或人工方式生成了大量的数据和报表,但是大量数据是分散的,难以实现自定义收集且可视化呈现不足,在进行数据报告撰写或者对某一类案件开展研判分析时,均需对采集的数据进行二次加工,无法通过信息化手段自定义获得,反而增加了工作量,在一定程度上有违信息化的便捷性,甚至重新回到了人工数据采集的老路上。

线上数据运营是做什么的,美团数据运营是做什么的?

图1 现有数据统计管理部门及统计方式

功能与需求不匹配,重管理而轻用户导向

2014年7月1日人民法院大数据管理和服务平台正式上线,该平台现已能够每5分钟动态更新全国3525家法院的案件信息,基于138张司法统计报表,面向全国法院按月、年一键自动生成580万张报表,进行可视化、多维度的案件审判态势分析,定期自动生成包含案件排名、案由分析等内容的审判态势报告(如图2)。但是实践中,该平台并未运用于所有法院,各地法院的报表生成仍有赖于各地区的审判综合系统,信息化发展不均衡导致功能和需求不相符合。审判态势分析和各院的质效评估密切相关,与法院之间的绩效评比等挂钩,因此往往会出现领导层关注整体审判态势,逐步倾向于指标化,以结果为导向展开管理工作,从而导致重结果而轻过程,重管理而轻用户导向,审判人员在绩效考核的压力之下,让法院的数据信息化工作和审判管理出现“两张皮”的现象。

线上数据运营是做什么的,美团数据运营是做什么的?

图2 人民法院大数据管理与服务平台界面

应用合作规范缺乏,潜藏数据安全与隐患

2020年,最高人民法院组织面向全国法院进行调研评价,从法院司法公开、诉讼服务、司法宣传等方面评估2020年全国智慧法院阳光化应用成效情况(见表1)。

线上数据运营是做什么的,美团数据运营是做什么的?

表1 全国智慧法院阳光化应用成效指数TOP10

资料来源:最高人民法院2020年全国智慧法院建设评价。

目前,全国已有91.7%的法院实现了科技法庭与审判系统对接,共有2169家法院具备随案同步生成、案件智能编目、数据化电子文件、网上阅卷、电子卷宗自动归档五项功能。法院的信息化建设合作方面,浙江高院与阿里巴巴集团就司法大数据平台建设签署战略协议,贵州高院通过搭建政法大数据共享平台将司法数据服务于司法工作,山东法院建成“山东法院数据服务云中心”,对各类数据进行集中存储、开发应用。安全保障是法院信息化的基础,更应该成为各项建设的逻辑起点。根据统计数据,人民法院数据安全和云安全建设还处于起步阶段,明显滞后于应用。不足60%的高级法院初步开展了云安全建设,具备云主机、云应用等基本防护能力;只有最高人民法院和35%左右的高级法院在数据分级分类、数据加密、数据审计等方面初步开展了数据安全基础建设;最高人民法院建成的可视化质效运维管理平台仅对25%的应用系统具备应急接管能力。此外,各地因信息化技术的发展水平不同,暂未形成统一的方法论指导与规范,部分地区与企业签署合作协议,进行部门数据和技术的外包,但是企业人员流动性大,也变相增加了潜在的信息安全风险,诸多问题使得急速推进的人民法院信息化面临较大风险。

数据挖掘深度欠缺,反哺成果转化率不足

数据不仅可以用来完成“历史画像”,而且,因为数据中隐含着规律性,对数据的深度分析有助于预测未来趋势。现阶段的大数据与司法审判融合产生的应用成果,诸如各地法院先后涌现出的“智审”“慧法官”等类案检索应用以及中国司法大数据服务网等,对司法大数据的运用局限于司法决策或审判质效评估领域,所涉及的数据也以结构化数据为主,数据价值尚未充分挖掘。根据中国司法大数据服务网发布的大数据专题统计(见表2),总计发布45篇司法大数据专题报告,与每年的审执结案件总数占比微乎其微,在深度挖掘方面效果不甚理想。

线上数据运营是做什么的,美团数据运营是做什么的?

表2 最高人民法院公布的司法大数据专题报告数量统计

各地法院所使用的应用系统,涉及的司法数据多只能静态、滞后、单一地反映某一个时间截面的历史情况,无法加以融合,以预见性、动态地发现问题。在大数据时代,这并不符合数据分析利用的要求,也无法满足法院诉讼服务、审判执行、审判管理、人员管理等相关工作的需要,造成相关数据价值开发利用率低。在数据转化为产品、服务公众和经济社会大局方面,更是应用成效低于预期,无法真正推进“以知识为中心”的智慧法院建设,暂时未能达到利用司法知识解决司法活动、甚至是社会活动中的复杂问题。

二、成因溯源:审判态势数据分析深度挖掘与应用的制约因素

数据资源释放巨大能量的同时,我们也面临数据制约甚至危机,其根源在于我们的认知水平、技术支撑、治理体系能力等方面尚未跟上大数据时代的步伐。

理念:排名倾向导致理解偏差

良好的大数据思维与理念,将有利于大数据在司法审判活动的融合应用,也是应用司法大数据并实现其核心价值的关键。大数据时代,法院信息化的广度与深度取决于司法本身的理论基础,科技只是锦上添花的手段,使其从理想落地为现实。但是,部分审判人员在长期的工作中形成了传统的思维定式和惯性,在信息化飞速发展的时代难免会产生无所适从之感,对于司法大数据的认知仅简单地停留在数据统计的层面,认为收案趋势、结案均衡情况、审判质效等分析即可涵盖司法大数据的边界,较少关注司法大数据深层的应用价值,对数据资源的价值和交互效应认知不足。此外,审判态势分析是对数据进行量化,其一部分弊端也将导致过度追逐排名,减损管理的实质作用,为行政化管理倾向增加负担。以上问题将导致司法资源的较大浪费,从而阻碍了司法大数据应用的健康发展,如果不及时转变思维理念,将审判态势数据分析作为中立的技术管理,司法大数据的应用将会出现低效和混乱的局面。

技术:壁垒林立增加“剪刀差效应”

1.“暗数据”累积导致利用受阻

人工智能技术与法院工作的融合处于发展阶段,算法仍需要创新和突破,数据处理能力和数据资源规模之间产生显著“剪刀差”,并呈持续扩大趋势。现有法院数据信息点经梳理可以看出,既有规范性法律术语和格式相对固定的法律文书等结构化数据,也存在非结构化或者半结构化的司法数据,后者相对于前者有着更大的技术难度,通过大数据予以智能转化应用更加困难,这就导致大量数据因无法或者来不及处理而成为未被利用、价值不明的“暗数据”。另外,各个行业的大数据算法均在一定程度上存在“黑箱”效应,即指大数据处理及决策行为的不可见。由于具体的算法通常为技术人员所掌握,法院工作人员、社会公众难以知晓掌握算法的运算过程和具体数值,也会带来大数据算法隐秘性和司法裁判公开性之间的矛盾。

2.应用有限难以实现变革突破

高速发展的智慧法院取得了很大成效,但仍有一些司法核心业务相关的重要技术目前处在试点或探索应用阶段,如移动办案、移动阅卷应用、执行全流程无纸化办案等系统应用仍然需要大力推广,范围还要扩大。只有加快此类能够大幅提升审判执行质效技术手段的落地步伐,方能满足快速增长的社会司法需求。此外,还有部分实体设施和系统功能尚未完全在实践中发挥应有的作用,如中国移动微法院目前涵盖了网上立案、案件查询、诉讼缴费、诉前调解、手机阅卷、计算工具、法院导航、跨域立案等主要功能,还有部分诉讼服务大厅中的设备耗费大量建设资金,但存在功能重复或遗漏问题。

体系:数据多源异构难建专业运营体系

海量的数据会与周围环境发生物质、能量、信息的交互,构成开放的复杂巨系统。数据汇集也带来风险的汇集,由于数据挖掘、分析、处理技术与数据脱敏技术呈现对抗性发展,导致多维应用场景下数据体量巨大,增长迅速,对数据掌控能力提出更为严峻的挑战。法院在审判执行活动中,收集汇总了大量的公共数据资源,但是法院本身并不具备数据资源运营管理的专业能力,大都委托专门的技术公司开展相关工作,但是这种模式很难将责任划分清晰。根据2019年12月中国软件评测中心评估板块发布的《政务数据质量管理调查白皮书》,截至2019年11月底,全国32个省(自治区、直辖市)中,有22个(占比68.8%)明确了政务数据统筹管理机构(见表3)。通过政府组成部门、政府部门内设机构等方式进行数据管理,从而合理划分责任,加强统筹力度。

线上数据运营是做什么的,美团数据运营是做什么的?

表3全国各地数据管理机构设置情况

综上,大数据时代,数据资源作为重要的国家战略资源,对外负有保障国家安全的职责,对内负有维护个人和企业等主体公共权益的责任,有必要将法院获取的公共数据资源作为类似矿产等自然资源进行专有管理,设置专门的数据运营部门。

三、建构基础:DQM数据质量管理在审判态势数据分析中的演绎

为推动审判态势分析的广度和深度,法院系统应引入数据质量管理(Data Quality Management,DQM),为设置专门的数据运营部门提供指引。数据质量管理,是指对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高,数据质量管理是循环管理过程,其终极目标是通过可靠的数据提升数据在使用中的价值,并最终为企业赢得经济效益,其应用流程优化思路如下(如图 3),数据质量管理并不是一个附加过程,而是要并入法院的具体数据处理过程,可以演绎为数据稽核、数据处理、数据服务与数据应用。

线上数据运营是做什么的,美团数据运营是做什么的?

图3面向法院系统的数据质量管理流程

数据稽核追求客观准确

大数据不仅是体量巨大的数据集,更是多元数据聚集关联后形成的某个领域的数据全集,能产生价值的是“数据池”。数据稽核是实现数据完整性和一致性检查,提升数据质量的过程,其作为数据库管控链条的基础,主要的属性指标包括准确性、完整性、一致性、唯一性、时效性等。对数据质量进行管理是数据分析的前提,审判态势数据分析运营部门,应结合上述指标属性,对法院审判管理活动中,从立案、调解、保全、证据提交、庭审、庭后合议、文书写作和送达到归档等全流程形成的数据进行汇总,以及使用标准化的流程和工具进行筛查,保证数据池数据的客观准确。

数据处理追求科学专业

“当我们在等待更强大的计算机、更智能的软件、更新的人类技术时,只有数据堆积显然是不够的。”在大数据时代,数据量极速增长、数据变化急剧加快、数据来源多种多样,更多的数据是以连续输入的形式进入数据处理系统,对连续数据的高效处理并从中提取出有真实、准确、有价值的特征结果不仅是数据质量管理体系的重要指标,对于大数据处理系统的处理效率和大数据应用价值体现都极其重要。该阶段是数据质量能够获得持续改进的重要步骤(如图4),通过不断的循环分析,提升数据展示的质量,从而获得更为科学的分析结果,为审判态势分析增添助力。

线上数据运营是做什么的,美团数据运营是做什么的?

图4 数据处理过程控制流程图

数据服务追求高效便捷

审判管理本质上应该是服务性的,与法院管理类似。主流学界对审判管理也秉持了“限定”“谨防”的基本态度。即相对于主体司法行为而言,以司法行为为对象的审判管理本质上应该是服务性的,这就要求审判管理与法官个体审判之间应该具有明确而清晰的界限,审判管理服务于司法审判,而不能左右法官审判。由此,实现“法官能动”和“法院克制”是法院审判管理体制改革的制度选择。审判态势数据分析运营部门的建立,在保障据数据采集客观高效、数据维护便捷的同时,更是服务于工作人员,让书记员或者法官助理从行政事务性的工作中抽身,以科技来替代重复性录入等劳动工作。数据服务既包括服务审判执行、服务司法管理,更是要服务人民群众,以专业化实现服务的高效便捷,从而更好履行保障法院审判良好运行的目的。

数据应用追求价值释放

海量数据背后的蕴藏价值,不仅仅是关系每个个案,更是有助于社会的发展。基于统计技术的传统数据分析模式,司法数据只能静态、滞后、单一地反映某一个时间截面的历史情况,无法加以融合,以预见性、动态地发现问题。在大数据时代,这并不符合数据分析利用的要求,也无法满足法院诉讼服务、审判执行、审判管理、人员管理等相关工作的需要,造成相关数据价值开发利用率低。同时,司法领域数据涉及面广、专业性强,数据特征往往隐藏较深,导致司法知识体系的构建困难。从数据池中挖掘潜在的、隐藏的、可能的、有特殊关联性或关系性的数据或信息,这些数据和信息均有可能指向先前未知的模式、内在联系、规律、发展趋势等。法院领导使用这些通过挖掘涌现的数据和信息作出决策,就是从数据挖掘到知识发现的关键步骤。审判态势数据分析运营部门在数据客观准确、数据分析专业、数据服务高效的基础之上,培养和提升数据挖掘能力,正是有机融合司法规律与科技成果的最佳实践。

四、跃迁之道:审判态势数据分析运营部门的实践路径

未来,要不断加大审判管理信息的利用深度和广度,使得开发的司法管理系统得到更加深入的运用。法院数据治理的内涵、框架、模式和机制都有待进一步探索,将数据治理与业务流程相融合并综合运用规则和技术实现协作共治是大势所趋,数据治理也逐步成为新的热点和关注点。

运营原则

1.数据安全原则

2021年6月10日,数据安全法审议通过,将于2021年9月1日起施行。“数据”作为一种新型的、独立的保护对象,已经获得立法上的认可。数据安全贯穿整个数据开发利用活动的全流程,数据伴随着实际应用和业务,在不同的载体之间留存和流动,贯穿法院信息化活动和审判业务的各层面、各环节。审判态势数据分析运营部门应遵循数据安全法的相关规定,掌握信息安全知识、提升信息安全意识,在信息化研发应用中加强信息安全管理,主动全面防御各类信息安全风险,消除各种安全隐患。

2.大数据工具主义原则

司法活动过程不是机械的认定事实并适用法律,其中还包括审判人员对案件背后蕴藏的社会价值的平衡、人性冷暖的感知、道德规范的判断以及司法功能的实现等裁判因素。这些案件之外的重要方面,难以通过大数据算法涵盖。因此,设立审判态势数据分析的运营部门,应坚守大数据工具主义的定位理念,不可陷入数据至上、科技至上的片面的、技术万能主义的窠臼,否则将会出现喧宾夺主、鸠占鹊巢式的替代性司法的情况。2019年6月,法国制定实施了所谓的司法大数据“禁令条款”,以防止司法大数据的应用,侵犯法官隐私,妨碍司法公正,损害司法权威。一旦陷入对大数据技术盲目推崇,片面夸大大数据的效用和功能,忽视技术本身的缺陷风险,甚至有意无意地掩盖一些非技术性而又非常重要的问题,这只会造成司法审判的“内伤”。

人员配置

审判态势数据分析部门的组建过程中,职位体系的设定将直接影响数据分析的效率和质量,由于数据活动既需要严谨性,也需要创新性,会涉及新的人员入职,例如掌握大数据技术的方案架构师、数据采集工程师、大数据研究员等,同时也会强化原有岗位的新生命力,例如司法行政装备科、信息管理处等部门。本文认为数据运营部门可以由如下几类人员构成:

基础平台类:具体分为硬件平台和软件平台两大类别,硬件平台包括服务器、操作系统和网络维护等工作,可以由现有的司法行政装备科、信息管理处等部门承担主要工作,与现阶段的工作内容类似,是在原有工作基础上增加更多关于大数据系统的运行内容;软件平台包括数据仓库管理、软件系统运维等工作,需要引入新的技术人员。

技术研发类:技术研发类岗位指的是针对大数据相关系统、软件、产品和功能进行开发。由于大数据类的开发是一个相对完整的工作链,并且具有特殊应用需求和场景特征,因此该类人员也需要涉及新的技术人员。

产品设计类:项目设计类岗位是有计划开发数据工作的基本前提,通常决定了一个产品或者项目未来的方向和具体实施的概念定义。该类人员既可以是新的技术人员,同时也需要审判管理部门抽调人员,从法院审判管理视角出发,为今后的数据运营方向进行设计。

工作流程

日常数据分析:审判态势数据分析运营部门承担日常数据分析,所有数据经过质量稽核检验后,进入数据运营管理系统,由数据运营部门进行梳理后加入数据池。根据审判态势分析、审判管理、质效数据分析、司法统计分析等不同工作内容,完成日常数据分析工作,并运用技术手段不断改进优化,最终提交数据分析结果。

自定义需求:各业务部门提出自定义需求,例如文稿撰写的专项数据需求、类型案件的分析研判参考、类案检索报告等,发送数据运营部门后,将经过数据分析、改进优化,最终得出分析结论,以供工作参考。

不论是日常数据分析还是自定义需求(如图5),此过程中的所有数据流转,也都会成为记忆数据,成为数据池扩充的重要组成部分。此过程中,日常数据分析更重要的是实现了数据的集中扁平化管理,大大节约了原有工作人员的统计分析工作量,避免了重复性劳动。自定义需求则是通过提出需求反向推动数据的应用与深度挖掘,从而不断完善和改进数据管理。

线上数据运营是做什么的,美团数据运营是做什么的?

图5 审判态势数据分析运营部门工作流程图

系统功能实现

审判态势数据运营分析部门的递进式系统功能实现(如图6):

线上数据运营是做什么的,美团数据运营是做什么的?

图6 审判态势数据运营分析部门的场景实现

1.汇集数据

面对大数据时代如此大规模的数据量,迫切需要建立专业部门来处理这些数据,进而对数据进行统计、分析和预测。如今的数据已经达到了极大的量级,数据量的限制正在消失,通过无限接近“样本=总体”的方式汇集数据,将为今后的数据精细化运作隐藏惊喜。

2.融合数据

司法数据的生命在于运用,但司法数据往往包括大量非显性的隐含知识,因此有效应用司法数据,必须首先进行科学的融合分析和数据挖掘。通过探索建立数据融合规则,依据法律知识解析并提炼半结构化和非结构化数据,基于语义实现结构化、半结构化与非结构化的同数据融合,并建立数据关联关系,形成高度融合的数据资源地图,解决数据的完整性、一致性和相关性问题。

3.数据共享

首先是致力于实现信息的全覆盖和信息流的顺畅无阻,构建集内部办案系统与司法公开、诉讼服务、沟通宣传等应用于一体的融合系统,对于外部要将人民法院审判管理与为诉讼参与人群体和相关公权力机关提供的服务紧密结合起来,实现一体化、融合性司法信息系统,将对内的案件信息管理、案件质效评估、案件质量评查、审判流程管理、审判态势分析、审判绩效考核等与对外的阳光司法、司法公开、诉讼服务、信息发布、沟通宣传有机结合在一起,将其统合于整体的智慧法院建设之中,共同助推司法公正实现与司法效率提升。

4.数据治理

在人民法院信息化顶层设计不断加强、大数据管理与服务平台功能充分发挥的基础上,利用司法知识工程解决司法活动中的复杂问题,进而从法律法规、司法审判信息资源库、司法领域信息化标准等数据源中,通过大规模背景知识支撑模型学习、推理和决策,为社会化活动提供知识性参考,推进“以知识为中心”智慧法院建设,为数据治理带来的现代转型跃迁贡献中国司法智慧。

结语

充分释放法院这座信息“富矿”的数据价值并不是一件简单的事情,这在很大程度上有赖于构建一套科学合理的数据治理体系。建立审判态势数据分析的专门运营部门是借助大数据之翼的一次初步尝试,尽管很多机制及配套措施、现有制度基础和背景并未处于理想状态,但是这是一次有益的尝试。通过专业化、规范化、体系化的流程,实现数据从计划、获取、存储,到维护、共享、应用等不同阶段的全流程管理和开发,试图解决权责不明、壁垒林立、底线安全等掣肘数据深度挖掘与应用的问题,真正实现智慧法院建设从以互联网和数据为中心向以知识为中心转变,让大数据蕴含的知识成为推动审判体系和审判能力现代化的核心驱力。

线上数据运营是做什么的,美团数据运营是做什么的?

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 sumchina520@foxmail.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.sumedu.com/faq/280408.html