摘要:8月29日,国家数据局会同科技部、农业农村部、文化和旅游部、中国科学院、中国工程院、国家文物局、国家中医药局等部门在中国国际大数据产业博览会上发布第二批28个“数据要素×”典型案例。第二批案例在注重发挥以数据解行业发展难题、促行业效益提升作用的同时,更加突出数据来源合规、治理有效以及依靠先进适用技术保障数据安全流通等内容,彰显数据要素推动经济发展的乘数效应。本文整理了前十四个“数据要素×”典型案例集锦,以供各位读者参考和借鉴。
打造农业农村大数据平台 有效支撑农业强国和乡村振兴建设为推动农业农村大数据共享,农业农村部大数据发展中心以农业农村用地“一张图”和乡村发展动态数据库为切入口,形成了“一个平台基座、一个关联通码、一个应用端口、一个云服务平台、一套数据标准”的协同推进体系,推动数据支撑政府部门科学决策,解决农业生产和农民生活需求,为政府、社会、市场提供了可感可及的农业农村数据服务。一是推动多方数据融合。依托农业农村部统计监测数据,充分利用航空航天遥感、移动互联网、物联网、人工智能、区块链、云计算等先进技术手段,建立一体化农业农村大数据自动采集体系,采集汇聚土地、农作物以及技术应用情况等数据,为每块地建立“数字档案”,形成农业农村用地“一张图”;为每个村进行“精准画像”,汇聚分析人口、土地、资产、生产、环境、气象、电力等数据,形成乡村发展动态数据库。图1 乡村发展动态数据库
二是“一座一码一端一云一标”五大抓手提升农业农村部门工作能力。打造“农业农村大数据公共平台基座”,帮助地方快速建立大数据能力,实现各级大数据平台互联互通。打造“全农码”,为涉农资源、主体、产品赋予数字身份,实现农村“地、人、物、财、事”全面关联。打造“农事直通”APP,为农业农村大数据提供统一服务窗口。打造“云服务平台”,提升云端计算和服务能力,实现平台功能的协作协同和数据的关联互通。成立农业农村部数据标准化技术委员会,构建统一的农业农村数据标准体系,为涉农数据共享交换提供遵循。图2 全农码大数据驾驶舱
三是拓展数据应用场景。辅助政府部门科学决策,开发耕地用途管控、种子监管、宅基地管理、头雁培育、新型农业经营主体、农村土地承包合同网签、土地承包经营权流转台账、农业综合行政执法等新应用。其中,头雁培育系统为4万头雁学员提供培训跟踪服务,有效支撑乡村产业振兴带头人培训工作。土地承包经营权流转台账信息平台已备案流转合同超过400万份,可对流转价格、主体、用途、年限进行动态监测。解决农业生产和农民生活需求,与科技企业、金融机构合作,支撑金融机构快速放贷,助力精准承保理赔,为超1600万农户提供保险核验或信贷评估服务。 截至目前,农业农村部大数据发展中心初步形成大数据“资源池”,汇聚了全国约11.07亿块农村承包地、96万个农村集体经济组织、9亿成员、400万家庭农场等数据,“全农码”累计赋码22.76亿个。推动通用数据产品陆续在省市县落地,其中,“农事直通”APP服务主体达106万。
多方积累和灵活运用农业数据,是发展智慧农业的基础和前提。目前,我国农业正处于农业机械化与智能化并行阶段,农业数据存在质量良莠不齐、融合应用不足等问题。为解决此类问题,中国科学院计算技术研究所通过搭建“智慧农业数据底座”,打通农场生产数据流,充分保障农业数据质量和安全,在施肥、施药、灌溉等耕作环节实现农业生产降本增效,带动粮食增产,农户和村集体增收。 一是推动多来源、多类型数据采集。建立“团连排班”四级网格管理体系(如图所示),通过卫星遥感、无人机遥感、地面传感器、人工采样、测土机器人等方式,采集作物分布、作物长势、土壤氮磷钾、土壤有机质、土壤墒情、农田病虫害、作物表型等多维关键要素数据,形成从土地环境数据到农业生产经营全链路的实时数据底座。图 “团连排班”四级网格管理体系
二是提升数据质量,保障数据安全。构建“农业大数据共性平台”,通过设计农业全要素数据采集标准,明确不同来源、不同类型数据结构和语义表示方法,有效解决农业生产数据格式不统一、数据来源不一致等问题,打造高质量数据资源。同时,实行网络安全等级保护制度,严守数据安全底线。 三是数据分析助力农业高效生产。在规模化施肥、施药环节,采集和分析土壤氮磷钾、农田病虫害、作物表型等数据,总结土壤肥力分布情况,绘制施肥打药处方图,为不同地块提供定制化保护性耕作措施,有效减少20%以上化肥和农药使用,降低耕作成本。在精细化灌溉环节,实时采集土壤墒情、肥力等数据,结合作物需水模型,判断作物各生长时期的需水量;采集管道压力、流量、阀门温度等数据,实现远程阀门控制和流量监测,制定差异化灌溉策略,变革传统粗放型的灌溉方式,缓解大水漫灌引起的水土流失、土地盐碱化以及水资源浪费等问题。 自2019年以来,中国科学院计算技术研究所累计服务了呼伦贝尔农垦600万亩耕地,安徽芜湖繁昌22.85万亩耕地,成功经验已拓展至河北雄安、内蒙古兴安盟、湖北十堰、河南周口、山东农高区等地共计1000多万亩耕地,在呼伦贝尔农垦大河湾1300亩核心示范区,实现平均节本增效104元/亩,在安徽芜湖核心示范区,实现平均节本增效300-500元/亩。
畜牧产业大脑助推畜牧业高质量发展
畜牧业一头连着居民“菜篮子”,一头连着农民“钱袋子”,事关国计民生。我国畜牧业产业链条长、生产周期长,存在产能调控难度大、动物疫病防控和畜禽产品质量安全监管难、供需信息不对称等问题。浙江省畜牧农机发展中心构建了集行业分析、监测预警、数据服务于一体的“浙江畜牧产业大脑”平台,为省畜牧管理部门及生产经营主体提供生产、经营、管理等数据支撑。 一是建成一体化畜牧大脑数据仓。通过与市场监管、银保监、生态环境等8部门数据共享、业务对接,建设畜牧大脑数据仓。目前已汇集数据2.2亿条,覆盖12类畜牧兽医业务主体,日访问量20万次以上。以生猪模块为例,在养殖环节实时汇聚省、市、县生猪存栏量、调入量、出栏量及价格动态等数据,指导生猪科学生产;在检疫、屠宰、调运环节汇聚产地检疫、屠宰检疫、肉品品质检验等数据,实现从养殖到市场全流程追溯。 二是构建智能高效风险预警体系。依托数据仓,开发稳产保供智能模块,通过产能测算模型,智能感知和分析生猪产量、猪肉价格、头均盈亏等数据,提前6个月预测研判生猪产能、猪肉供应的波动风险,辅助畜牧管理部门提前部署稳产稳价调控措施。开发疫病风险管理模块,密切监测屠宰、检疫、调运等环节的动态数据,设置非洲猪瘟、口蹄疫检测等19个风险点,制定36条触发规则,实时研判分析风险情况,并精准推送至养殖、调运等畜牧主体及管理部门,实现重大风险早发现早处置。 三是推动数据要素增值赋能。在畜产品信息追溯方面,与市场监管部门协同,实现养殖场信息向产地检疫人员全推送,省内检疫、备案等信息向屠宰企业、驻场官方兽医全推送,屠宰企业检疫申报、检测、宰前检查等全程信息向驻场官方兽医全推送;同时与卫健部门协同,深化数据共享、风险评估、联合处置等工作,做好公共卫生安全追溯,守好人病兽防关口。在解决农户需求方面,为农户精准推送保险信贷、价格行情等服务,推动农户生产管理、检疫申报、受理、出证、扫码等业务办理“零跑腿”,实现贷款一键申请,保险一键参保、一键赔付,2023年,已辅助249个养殖场抵押授信7.21亿元。 2023年,平台发布产能预警共计790次,处置安全风险2.16万次,帮助养殖户降低经济损失6500多万元。基于数据分析大幅提升检疫效率,单个屠宰企业日均检疫、检验出证时间分别缩短98分钟(降幅68.5%)和104分钟(降幅70.1%)。产业链数据要素应用 赋能产业协同效率提升
煤炭是我国的基础能源,在保障国家能源安全中发挥着“压舱石”的重要作用。当前,煤炭产业生产、物流、金融等环节数据分散、孤立,导致产运信息不对称、服务不到位等情况频现。国能互通内蒙古网络科技有限公司通过整合煤炭产业从生产、运输到消费端的各环节数据,开发了能源产业智慧服务平台,为煤炭能源企业提供精准对接、风险评估等数据服务,助力煤炭产业供应链高效精准对接,显著提升煤炭等能源产业协同效率。 一是整合产业数据资源。基于企业授权,获取企业的行为数据;通过合作协议,获取矿场、贸易商、电厂、钢厂、加工、金融机构等企业的生产、交易、物流、仓储、支付结算、票证等数据;通过与公路、铁路、港口等部门进行深入合作,基于合作协议获取“公铁水”运输数据。然后对数据进行标准化清洗、多维验证等处理,形成煤炭产业数据资源,每日新增各类数据近100万条。 二是丰富数据应用场景。通过分析企业生产经营、交易订单、物流等数据,形成企业经营画像,为金融机构提供金融服务额度测算、风险控制实时预警等服务,帮助中小企业拓展高效、低成本的供应链融资渠道。通过打通生产、流通到消费等各环节数据,构建智能的辅助决策体系,为产业链上下游企业提供优质客户筛选与管理、客户经营画像分析等服务,帮助企业实现精准运营管理。 三是多手段保障数据安全。联合编制数据存证、脱敏、加密、存储、使用等多项标准规范。建立合规审查、分级分类、交叉验证等管理机制,在支付、交易、物流、身份认证等环节应用区块链技术,确保全部数据的安全性和不可篡改性。严格遵循用户授权及数据最小范围流出原则,流通数据以系统生成或加工处理后的数据为主,禁止原始数据流出。图1 数字化生态平台作为产业链连接器
目前该平台已为5000多家煤炭行业用户提供了数据服务,累计服务煤炭交易量8.8亿吨,交易金额2600亿元,有效支撑煤炭行业提质增效。平台与新华社等单位发布5项能源价格指数,为市场提供定价参考,为政府宏观调控和行业监测提供支撑。
餐饮行业是促消费、惠民生、稳就业的重点领域,与人民的生命健康和生活水平紧密相关。当前,连锁餐饮行业面临经营数据收集难、数据化运营能力较弱等问题。企迈科技有限公司通过整合线上线下企业业务数据和线上用户行为数据,基于实时数据分析,为餐饮企业提供智能补货、门店经营分析等数据服务,赋能企业精细化运营,推动企业数字化转型。
一是多渠道采集汇聚数据。一方面,在消费者、品牌及平台协议授权的前提下,通过小程序、POS收银平台、第三方平台等渠道,采集涵盖订单、卡券、资产、营销以及其他日志等方面的相关业务数据;另一方面,基于企业合作协议,汇集餐饮商家经营管理中的营销活动、上架新品等对应的经营类数据。然后按照统一标准对数据进行整合治理,形成日增量约30TB、累计总量超过2PB的餐饮行业数据资源池。 二是开发覆盖经营全渠道的数据服务。基于用户行为数据,建立实时、全方位的用户标签体系,支撑企业为客户提供个性化的会员服务。基于商品销售、原材料库存等数据,构建门店智能补货与预警系统,为企业提供新品挖掘、销售预测、货品生命周期管理等货物服务。基于门店客流、财务、业绩等数据,打造门店全生命周期管理模型,为企业提供门店盈利评估、智能选址、业绩分析等门店服务。企业使用相关服务后,运营成本平均降低31.32%,用户拓展平均增长240.57%,订单增长提升121.89%,客单价提升14.50%。 三是强化数据全流程安全治理。数据资源从采集到汇聚、流通的整体过程中,敏感数据均采用源头脱敏和加密存储,对存储系统实行网络隔离。通过与专业安全机构合作,利用专用的数据处理平台进行整体的数据安全管控,涵盖脱敏、权限管控、审计、审批、水印等。建立分类分级、权限管控、安全培训与审计的企业数据安全制度,制定数据安全管理办法,设立系统安全、数据安全专人专岗。图1 餐饮行业数据接入与应用
图2 经营分析驾驶舱
图3 全渠道数据融合分析
零售行业是国民经济的重要组成部分,与居民生活紧密相关。当前,传统零售企业面临产业链上下游不匹配、消费者需求响应不足、运营管理效率较低等问题。山西全球蛙电子商务有限公司有效整合零售行业采购、供应、销售、服务等全链路数据,推出了智能补货、供应链优化、供应链协同等服务,提升传统零售企业服务效能,助力传统零售业转型升级。
一是推动多方数据采集汇聚清洗。全球蛙公司基于消费者授权,获取消费者线上购物的浏览、搜索、购买、评价等行为数据;通过与平台合作商户签订数据授权使用协议,获取上游供应商的库存、物流、价格等,以及下游零售商的销售、库存动态等数据。同时,借助人工智能、大数据等技术对数据进行清洗、整合与处理,形成覆盖30个省份连锁商超的超100TB数据资源。 二是强化数据安全与隐私保护。在对数据进行脱敏处理的基础上,建立严格的合规审查机制,利用可信计算等技术,建设安全可信数据空间,促进多主体间数据的安全合规流通与共享。利用信封加密技术,从源头到终端全程加密,防范数据传输中的安全风险。采用数据脱敏、加密、访问控制等多重防护措施,保障数据安全。 三是面向用户需求开发数据产品和服务。通过分析顾客年龄分布、购物频次、偏好品牌、热门时段、历史销售等数据,构建消费偏好图谱,为超市商户开发市场洞察、供应链优化、智能补货等数据产品和服务,提升超市运营效率和决策精准度,助力超市客户转化率提高15个百分点,客单价提高10%,直接带动整体销售额增长约15%,库存周转效率提升30%,节省库存成本约2000万元。通过订单数量、订单类型等数据加工和分析,帮助产业链上下游企业精准对接产品供应企业和消费客户群体,加快业务流程响应速度,实现供应链精细化管理,使订单处理时间平均缩短15%,每日处理订单量提升20%,采购到销售周期缩短20%,资金使用效率提升近33%,供应链协同效率提升40%以上,供应链响应速度平均缩短10个工作日。江海联运是提升水运效率和灵活性、助推区域产业发展的重要手段。但江海联运涉及物流链主体多、环节多、链条长,若管理调度不到位,则难以发挥联运优势。舟山市港航和口岸管理局、中国电信舟山分公司通过建设江海联运数字化平台,贯通全链条物流数据,实现企业申报、港口调度、码头装卸、货物配送、物流跟踪等多业务协同,提升物流组织效率,推进江海联运高质量发展。
一是跨区域合作,实现多元数据汇聚。舟山市与张家港、江阴、南京、武汉、重庆等25个长江物流节点城市共建江海联运数据联盟,推动流域数据共享共治。通过公共数据平台共享海关、海事、边检、港航等政府部门数据,同时,平台构建港口全景、口岸通关、物流跟踪、船货撮合等120余项航运服务,以提供服务方式归集产业链上下游的企业数据。通过向专业第三方数据商购买的方式,获取船舶自动识别系统数据、气象数据、海图数据。目前,数据汇聚量已超16亿条,梳理形成了包括港口、船舶、通关、物流、气象等10大类主题的数据库。
二是推动数据共享互认,实现多业务协同。平台与江海联运数据联盟内的25个港口物流信息平台进行系统对接,以API接口形式进行数据流通,通过数据传输加密、网络可用性管理保证跨区数据交换安全。构建江海联运数据交互共享机制,联合15家单位出台《大宗散货江海联运信息互联交换标准》,规范数据交换项、数据交换方式、数据交换频率、数据传输安全等内容,年数据交换量达1200万条。同时,平台打通国际贸易单一窗口、边检船情系统等13个系统用户体系,整合边检船情、引航调度等申报项,缩减800多个重复数据项,形成“船舶进出境一张表”。企业通过平台分别向海关、海事、边检、港航部门同步分发所需审批数据,各部门并联审批,审批结果在平台一链反馈,从而推进港航、海关、海事、边检等跨部门共建共用业务模块,代理、供给、运输等经营主体跨业务合作。 三是数算融合,不断拓展赋能场景。融合海图、船舶自动识别系统、气象、作业、通关、船舶作业视频等多源数据,自动识别船舶运输状态,按照起运港、目的港、船舶名称、船舶类型、载重吨、当前运输计划、位置远近进行智能检索,开发了联运快申报、直达快配送、物流快组织、市场快服务等一批实用场景。通过研发航线找船算法,实时分析“船、港、货”和航线数据,将供应链企业、货主各方的运输需求、配送计划与船舶吨位、船舶类型、船舶运力等信息进行智能匹配,结合各港口作业计划智能筛选和推荐可供选择的船舶资源。打造航运服务超市,整合船货撮合、船舶交易、船舶维修、船舶供应、船员服务、船货代理等服务,实现航运服务的一站式精准查找。 通过数据的高效利用,江海直达配送每航次物流周期缩短4天以上、中转损耗减少7万元,大幅提高长江黄金水道运输效能。企业办理进出港手续时间从原来的16小时压缩至2小时,船舶平均在港时间减少1天以上,每年可为企业节省船舶租金等费用超13亿元。图1 联运快申报
图2 大宗商品直达快配送
公路运输占据我国货运体系中的首要位置,承担着约70%的客货运输量,是国民经济发展的重要保障。然而,由于公路货运涉及主体众多,行业分散性强等特点,导致运输体系存在信息不对称、供需难匹配等问题。江苏满运软件科技有限公司通过汇集订单信息、地理位置、货物状态、运输轨迹等公路货运行业各环节动态数据,实现数据共享与互通,为产业链上下游参与主体提供有效服务,助力提升公路货运车货匹配效率,降低物流综合运输成本。
一是多渠道数据汇聚形成数据仓库。通过多方安全计算、产业链上下游企业数据API调用等交互共享机制,获取并整合车辆道路运输证号、从业资格证号等外部数据;通过数据挖掘、数据脱敏等技术挖掘公司内部数据,包含“长途整车”“同城短途”“大票零担”等类型。搭建全国公路干线物流最大的数据云仓,覆盖全国公路干线物流行业货源、车辆、交易、价格、轨迹、路线等各类数据。累计形成全国330多个城市、10万多条线路的数据资源,数据规模超过24PB,为公路货运智慧物流服务提供坚实基础。图1 企业数据仓库
二是搭建智慧物流平台,助推公路货运数据协同融合。采用大数据实时决策智能算法、车辆实时定位、供需智能预测与车辆调度等技术,通过离线计算、实时计算等功能,搭建道路运输服务大数据、轨迹定位、供需预测等系统平台,提升数据使用与开发效率,实现司机与货主分钟级车货匹配。2023年,平台撮合交易额约3000亿元,成交订单约1.6亿个,大幅缩短货运匹配时间,降低综合运输成本10%至15%,提升单车运行效率30%以上,每年减少碳排放量约1200万吨,平均为每位司机降低燃油费用支出1万至2万元,促进物流降本增效和节能减排。图2 道路运输服务大数据平台
图3 订单轨迹系统平台
图4 供需预测系统平台
三是建设Saas型运输管理系统,推动中小物流企业规范化运营。利用自身数据资源优势全面赋能物流企业,为其提供领先的物流信息化管理等专业解决方案,融合互联网技术、车辆定位技术,服务于物流企业中的零担、整车运输场景。系统包含了订单管理、运单管理、回单管理、车辆管理、客户管理、财务管理、组织管理、智能报表等八大模块,并通过连接发货人、收货人和不同承运企业,帮助物流企业更好、更快完成管货、管车、管人、管财务的工作。 四是建立纵深防御体系,保障数据安全。积极有序推进数据分类分级,在采集阶段公告用户隐私政策,在具体场景公告采集数据的内容和用途并让用户选择授权。同时,建立覆盖管理、技术层面的纵深防御安全体系,健全安全开发生命周期管理流程,设计安全编码规范、安全开发红线检测、黑盒测试等安全措施,确保对网络安全事件的及时发现和处置。
公交数智化运营助力提升市民生活品质
公共交通作为城市交通的骨干,为市民提供高效、环保的出行方式,缓解交通拥堵,降低环境污染,促进城市可持续发展。公交行业在传统系统架构下,存在营运资源利用不充分、难以形成科学高效的线网规划与调优能力等问题。重庆市公共交通控股有限公司通过架构重塑、数据治理和场景构建等措施,实现数据资源共享、多跨场景协同管理、人车资源统筹优化,满足市民高品质、多元化出行需求,促进了重庆公交的高质、高速、高效发展。
一是新型数字化架构推进数据资源汇聚、治理。打造终端互联感知体系,实现包括司机信息、车辆信息、客流量信息、乘客满意度与投诉信息、线路高低峰客流量信息、停车场信息等“人、车、站、线、场”全要素的感知互联。同时,整合内部运营数据和高德出行、气象地灾预警等外部数据,实现日均接入数据4300万条,日均调用数据110余万条,累计接入数据125.43亿条。持续开展数据治理,建立主数据规范,明确主数据属性名称、分类定义、数据类型、管理流程等,从数据全生命周期的角度管控数据、治理数据。同时,根据业务需求,建立运营、安全、机务、服务等统计指标体系,严谨明确各项指标的业务定义、计算方式、应用场景,确保公交集团统计指标的准确性、权威性。 二是运营数字化升级实现人车供需匹配。通过升级智能调度系统,实现远程集中调度、多方式车辆监控、车辆到站时间预测、运营日报自动生成等数字化应用。打通与安全监控系统、智能维保系统、岗前监测系统等系统接口,实现跨部门、跨场景的协同管理。通过系统升级,调度班次自动生成率、人均发车班次、单人单日最高发车班次均得到大幅提升。通过重庆公交数字运营中心,完成站点客流分析、班次分析、热力图、线网覆盖率、线路效益分析、公轨接驳客流人次等分析功能,以供需平衡为导向,主动优化调整线网及运营组织方案,实现“客流、运力、路况”资源匹配的智能排班。基于区域化运营理念,对多线路多班次进行混合调度,实现广域不均衡出行需求的动态精准匹配和区域人车资源统筹优化。 三是全面构建数字交通新场景。对外构建互联网“愉约出行”平台,通过发布车辆到站时间动态信息和推出手机移动支付系统,方便市民公交出行,满足高品质多元化出行需求,集观光巴士、机场快车、定制公交等出行方式于一体,共开通定制及观光类线路130余条,年运送乘客2000余万人次。建立需求响应公交运营服务模式,在固定服务区域内根据出行需求开行不固定线路,利用最少的车辆、线路资源,解决了区域覆盖,实现线上+线下服务,承诺乘客最短出行时间,让市民出行更加便捷高效。对内打造“重庆公交生产助手”应用,面向驾驶员和各级管理人员提供查询、自助服务、审批等移动应用相关的90余项功能。截至目前,移动端员工用户数量2.5万余人,日均访问量24万人次,日推送信息8.5万余条。 自2020年以来,重庆公交集团优化线路约800条次。公交日均客流量于2022年超302.7万人次,于2023年超344万人次。目前,重庆公交集团拥有运营车辆8820辆,日均运行班次9.6万班次,日均运行里程140万公里,公交出行分担率为35.3%,以全国城市第十一位的车辆规模运送全国第二的客流,运营效率位居全国前列。
能源物流数智化管理 引领危化运输新模式
危险化学品运输是物流行业中一个特殊的组成部分,相对普通的物流来说,危险品的物流专业技术要求更高,更需要全面、准确、可靠的信息管理和控制。针对危险化学品运输作业安全风险高、车辆运行分散、通行限制多等行业特点,新奥能源物流有限公司通过集成人、车、路信息,构建“运途云”危货运输数智管理系统,全方位助推危货运输企业安全管理升级和运营降本增效,形成“数据驱动、科技护航”的危化品运输新模式。 一是汇集危化运输全要素数据。新奥能源物流与交通运输部公路院、清华大学、吉林大学、武汉理工大学联合研发岗前一体机、出岗一体机和在岗手环监测设备,通过签订知情协议书获得驾驶数据采集授权,实现驾驶员“速度估计、选择反应、深度知觉、注意力分配、紧急反应、驾驶风格、身体状态、风险感知”等指标的动态评估,累计收集驾驶员动态监测数据5000余万条,通过数据模型分析将驾驶员健康数据情况在运途云数智平台看板进行展现,实现对驾押人员的前置主动安全管理。已累计接入全国近70%的LNG运输槽车,服务3座沿海LNG接收站、1000余家危化品运输企业和工业园区。
二是建设“运途云”危货运输数智管理系统。为企业提供人车实时在线监控、安全报警、成本管理、效益分析及线上通行审核等全方位服务。危货导航功能累计安全护航运输任务15000余次,未发生安全事故。车辆出岛实现提前线上审批,线下等待时间缩短77%,车辆周转效率大幅提升。通过政企联动,将LNG接收站外运车辆安全综检数据进行线上留痕,与高速交警线上审批端口打通。同时,平台采用了先进的数据加密技术,确保数据在流通过程中的安全性,消除了数据泄露风险。
图 “运途云”危货运输数智管理系统
“以数补链”发展新质生产力 赋能车路云一体化产业能级提升车路云一体化是包括云计算、人工智能大模型等新一代信息技术深度赋能汽车和交通产业的战略性新兴产业,未来发展潜力巨大。智能驾驶汽车测试存在数据采集成本高、周期长、高价值场景缺乏等痛点问题,浙江德清莫干山智联未来科技有限公司、德清县数据局、阿里云计算有限公司、杭州数据交易所有限公司等单位联合构建以车路一体化场景数据库为核心的数据要素流通平台,通过融合红绿灯、交通事故、道路施工等公共数据和路侧车路协同行业数据,提供智能驾驶仿真场景库,基于先导区已建成的智能网联汽车封闭测试场和全域开放测试道路,补全“仿真测试-封闭测试-开放道路测试”的智能驾驶研发测试服务全链条,构建“以数补链、以链优数”的产业协同创新生态。
一是以授权运营促行业数据流通。依托省、市公共数据授权运营平台,针对数据产品开发所涉及的字段实施分类分级脱敏管理,将脱敏后的交通信号灯、道路施工、交通事故等公共数据,融合路侧设备采集和感知融合后获取的路侧交通参与者、路况感知等数据,为智能驾驶和交通等行业大模型训练提供了智能数据底座。 二是以场景驱动补数据服务链条。研发上架智能驾驶仿真场景库、路口车流量统计等系列数据产品,服务自动驾驶系统仿真测试、交通违法治理辅助决策、优化能源基础设施规划与选址等场景。截至目前,累计为20余家车企、交通研发企业和高校提供服务。 三是以标准体系筑数据安全底线。聚焦车联网数据安全生命周期,率先出台数据脱敏和分类分级两方面地方标准规范,创新车路云一体化数据要素流通平台全流程监管技术,实现数据“采存算管用”的全过程安全保障,筑牢数据安全合规利用底线。 四是以登记交易引数据资产增值。有关数据产品通过上架杭州数据交易所等交易机构,完成合规认证和数据要素流通交易闭环。实现国家级车联网先导区行业数据产品场内交易。搭建普惠金融综合服务平台 破解中小微企业融资难点问题
为完善西藏数字金融基础设施,加快涉企信用信息归集共享,有效激活信用数据价值,西藏高驰征信有限责任公司基于区内涉企信息数据,搭建了西藏自治区普惠金融综合服务平台“藏金普惠”,为西藏各级政府部门、金融机构和企业提供可靠、高效的征信服务,有效推进西藏高原经济的高质量发展。 一是汇聚多源数据。经政府部门同意,汇聚拉萨海关、税务局、科技厅、经信厅等12个部门数据;与自来水公司、燃气热力公司建立合作关系,通过接口对接、线下对接等方式,融汇水、气、热力等民生数据;通过与企业签订授权协议,获取平台内企业相关数据。汇聚整合工商、司法、住房、银税、专利、企业等多源数据,形成了涵盖10大领域100多个维度的企业信用专题库,实施“一企一库”管理,结合监控、定时更新等机制,实现数据高效流转。 二是打造综合金融服务矩阵。基于业务场景需求,利用机器学习、自然语言处理、区块链等技术,构建客户画像模型、反欺诈模型、经营准入模型、客户评分模型等信用模型,依托藏金普惠平台正在与银行联合开发税务贷、政采贷、公积金贷等定制化产品,打造“全线上、全场景、全主体、全周期”的综合金融服务矩阵,以数据“可用不可见”方式为金融机构和政府部门提供定制化信用报告,实现金融政策、产品、服务“一站式”供给。 三是搭建数据资源管理服务平台。依托数据流通机制,遵照数据使用权限,平台面向政府部门、金融机构与企业,实现数据交换、服务的统一接入和开放。基于平台提供加解密、鉴权、协议转换、注册服务、身份认证、异常处理、服务路由、日志管理等服务。通过数据接口管理、元数据追溯、数据分类分级等管理方式,结合统一的对外标准化服务封装,将以往各系统、各平台之间点对点连接形成的网状拓扑结构,优化为星形拓扑结构,大幅降低数字金融服务网络复杂度,提高了各应用场景数字金融服务研发效率。图 “一企一库”企业信用主题库架构
目前,藏金普惠平台已汇集涉企数据超1亿条,入驻企业超1.1万家,占比达到西藏中小企业总数的15%,入驻金融机构网点345个,占比达到西藏金融机构网点的99%,发布金融产品超200个,融资申请超2100笔,授信额度超340亿元。
科技文献数据挖掘 助力科研效率提升和大模型训练
科技文献为科学研究提供了丰富的研究资源与参考资料,是学术交流的重要媒介。科技创新需要大量科技文献数据支持,但传统文献文档内容结构松散,信息分布呈现碎片化特点,导致数据筛选整合低效,严重影响科研效率。中国科学院文献情报中心联合相关单位借助人工智能技术,深度挖掘科技文献中的数据价值,构建覆盖多领域的高质量数据集,支持科技领域大模型建设,助推科研范式变革。 一是合规归集高质量科技文献数据。在遵循知识产权法规和国际通行规范的基础上,充分发挥中国科学院文献情报中心和国家科技图书文献中心(NSTL)的学科优势,与领域内的科学家紧密协作,汇聚大量权威可靠的科技文献数据及专业领域知识。通过对科技文献全文数据中的文本、图表、公式等进行多模态解构,构建了一个覆盖多个学科的综合知识资源库,不仅包含了传统的文本信息,还涵盖了图表和公式等非文本元素,形成一个全方位的多模态知识体系。目前公益学术平台(PubScholar)已归集1.8亿条文献元数据,逾8065万篇完整的文献全文,为科研人员提供了丰富的研究素材和知识支持。
二是突破关键技术研发科技文献人工智能引擎(SciAIEngine)。提出了掩藏句子模型(Masked Sentence Model)与两阶段方案实现文本中的知识抽取,基于层次分类器集群实现千级类目中图法分类,通过嵌入词典和词性特征实现关键词识别,基于小样本数据利用半监督迭代学习等技术实现命名实体识别。利用这些创新技术,提升文本挖掘能力,研发科技文献人工智能引擎(SciAIEngine)。形成一系列可供扩展应用的软件、数据、解决方案和工具集,并提出了一套从科技文献中挖掘领域知识与科学数据的流程方法。
三是深度挖掘科技文献内容。利用科学人工智能引擎对优选文献进行深度挖掘,提取包括关键科学数据、实验结果等硬信息,提取理论框架、研究方法等软知识。通过深度挖掘科技文献的专业领域本体知识、科学数据、观点倾向等科技文献内容,建立细粒度科技文献内容与句子、段落、图表、全文之间的循证关系,支持文献内容溯源。将细粒度知识与科学数据进一步融合、精选、对齐、补齐,构建高质量语料库、专业化领域知识本体库、适用人工智能的科学数据集和研究观点倾向库。当前已支持上海药物所从文献中挖掘药物靶标数据,支撑新药研发;与西南交大合作挖掘二维材料属性数据,赋能材料研发;与东北地理所合作挖掘木质纤维素生物降解知识,助力黑土地生物质高效利用。
四是建设科技文献大模型。基于专业化领域知识本体库、适用人工智能的科学数据集、研究观点倾向库构建支撑智能科研(AI4S)的科技文献知识底座,支持AI4S模型的训练,为AI4S智能模型假设的提出、预测的验证和推理的监督提供知识基础。与头部人工智能企业合作,集成知识图谱、语义搜索等功能,打造支持智能化科研的解决方案。同时开发医学、化学领域的垂直大模型,为科技创新提供知识数据支持。其中,科技文献大模型提高论文调研效率10倍以上,论文研读有效率超90%。
图2 PubScholar公益学术平台
工程科技数据融合 加速工程技术创新
高质量数据是开展工程科技战略咨询不可或缺的基石。然而,工程科技领域的数据往往零散无序,数据源壁垒高筑,信息孤岛林立,数据难以互联互通。为此,中国工程院战略咨询中心联合浪潮软件科技有限公司汇聚和整合工程科技领域数据资源,实现跨领域数据融合和资源共享,促进知识倍增效应,为科技战略咨询、工程科技创新和国际交流合作提供信息支撑和知识服务。 一是持续推进数据资源汇聚整合。持续推动工程科技领域“元数据海”及特色资源建设,汇聚工程科技能源、交通、航天、化工、信息技术、海洋、地质、气象等30多个专业领域数据资源,工程科技领域一级学科覆盖率达100%,二级学科覆盖率达90%,数据总量超过72亿条,资源体量100TB。基于工程科技领域多源异构数据融合的大数据存储和处理技术搭建了资源汇聚加工的技术环境和数据采集、治理加工工具,支撑了知识服务搜索引擎、智库研究、技术洞察与趋势分析等应用场景,形成了一套科学的资源管理体系,推进生态、气象、环境、水利等跨领域基于地理和机构等维度的知识融合。
二是建设高价值特色数据资源。在数据治理的基础上建立了统一知识图谱构建、人工智能开发服务、技术洞察及趋势分析、词表集成等能力,为数据挖掘分析、知识关联发现提供技术和能力保障。构建工程科技专家库、机构数据库、战略咨询资源库、学术会议资源库等8个主题库,基于知识组织与知识计算等前沿技术对咨询报告等资源深度加工,形成特色数据资源。
三是实施全面的数据安全控制措施。依托知识中心的数据安全管理规范,对数据资源处理流程实行端到端的监控;依据数据资源的分类分级管理制度,实行差异化管理策略,对数据进行分类存储,并对敏感信息采取加密和脱敏处理。此外,构建了数据缓冲区,利用大数据批量标注技术、内容安全审核API同时结合人工复审的多层防护机制,建立健全数据安全保障技术体系。
四是整合多元生态打造精品化知识服务。聚焦国家战略和特定用户场景,利用已汇聚的海量数据资源,结合人工智能、大数据挖掘等技术,开发系列精品知识服务产品,建成了多学科融合的工程科技大数据服务平台。此平台包含服务于高端智库、科研人员和社会公众的多样化工具和专题,如智库支持系统、全球项目库、知领战“疫”系列等。这些知识产品广泛应用于图书馆联盟、高校及机构中,惠及科技界,形成了全面而深入的服务生态。
目前已汇聚工程科技30多个专业领域的数据资源,覆盖工程科技领域全部一级学科,满足高端智库咨询研究工作所需。累计为100多个国家重大项目与工程、数十家企业、科研机构与地方政府提供了数据支持、决策支撑服务,为全国2000余家高校、130余家科研单位、60余个地方图书馆的科技工作者提供数据和知识服务。联盟式知识中心建设为推动我国工程科技领域大数据共建共享、行业和地方大数据系统建设提供了有益经验。
图2 知识中心门户
来源:国家数据局
赛智产业研究院能够为政府和企业提供数据要素研究咨询服务,全面助力国内数据要素市场建设。
赛智产业研究院能够为政府提供数据基础制度咨询、数据法律政策咨询、数据市场监管咨询、公共数据管理咨询、数据服务产业规划、数据要素园区规划等咨询服务。
赛智产业研究院能够为企业提供数据战略规划、数据治理咨询、数据技术架构、数据资产管理、数据应用方案、数据商业模式等咨询服务。
更多精彩内容请登录http://www.ciomanage.com官方网站
或扫描下方二维码,点击关注微信公众号(ID:sagetimes)
北京赛智时代信息技术咨询有限公司(简称赛智时代)是国内知名的数字经济等新兴产业的咨询规划、大数据分析和产业生态体系建设的创新型公司。业务范围涵盖了智库咨询、数据服务、软件平台以及会议培训等方面。其中智库咨询服务依托于赛智产业研究院丰富的行业资源和高端专业化人才等竞争优势,面向政府、园区和企业,提供发展战略与规划、政策研究、招商引资策略研究、智慧城市规划、运营模式研究等现代咨询服务。研究领域涵盖大数据、人工智能、区块链、5G、战略性新兴产业等行业领域。饮鹿网(Innov100)是赛智时代旗下的产业创新创投数据平台,覆盖新兴产业近20万创新型企业,为客户提供创业孵化、投融资等服务。赛智区块链(北京)技术有限公司简称(赛智区块链),是一家专注于企业级大数据区块链产品与应用服务的高科技企业。 公司地址:北京市朝阳区大屯里317号金泉时代广场三单元2216北京市数字经济战略研究
北京市数据要素市场促进服务(北京市新型数据交易规则体系设计)
北京数据先行区关键机制创建服务
贵州省加速构建数据要素市场培育新兴产业课题研究
国家大数据(贵州)综合试验区实施方案
中国数据服务产业图谱研究
内蒙古自治区大数据中心数据要素市场化规划咨询
保定市数据服务产业发展规划编制
朝阳数据要素市场发展研究
丰台区数字经济倍增发展路径研究
北京市大数据立法数据支撑服务
北京市智慧城市建设协调推进项目
中国算力网络发展研究白皮书
重庆两江新区数字经济发展规划
贵阳市大数据五大新领域(人工智能、量子信息、区块链、物联网、5G移动网络)产业规划
南宁市元宇宙产业创新发展研究
贵阳市数字经济产业招商引资项目评估
智能贵州发展规划
贵州省大数据新领域产业发展指南
北京市大数据应用发展报告
天津市大数据应用场景建设计划
贵州省大数据战略行动计划编制
贵州省“十三五”以大数据为引领的电子信息产业发展规划
丽水市城市大脑开发建设研究
贵阳市新基建“十四五”发展规划
中国数谷顶层设计方案
贵阳市数博大道产业规划
贵阳区块链发展白皮书
贵阳市大数据发展“十三五”规划
贵阳市数字经济发展规划
观山湖区呼叫中心产业园规划
济南新型智慧城市规划
南宁大数据建设工程规划
航天科技车联网产业商业模式研究
阿里云数智化敏捷组织:云钉一体驱动组织转型研究
百度区块链研究项目
实创集团智慧城市业务战略规划
云上贵州集团业务战略规划
饮鹿网精准招商大数据云(平台)是赛智产业研究院联合饮鹿网开发的针对产业招商的最新产品。涵盖大数据、人工智能、区块链、5G、智慧城市、 工业互联网等 30 多个领域,为招商部门、产业主管部门、园区管委会和产业地产提供大品牌招商、产业筛选招商、产业生态链招商、重点产品招商、资本注入式招商、区域一体化协同招商、原籍创业人才招商等招商数据分析服务。
政府提供新兴产业的产业链、企业、技术、投资等数据分析服务的平台,主要为各地发改部门、工信部门、产业分管领导提供产业仪表盘、产业链分析、产业地图、产业发展要素分析、产业政策、产业洞察等产业数据分析服务。
服务于创业投资领域,为母基金、头部投资机构、地方政府产业基金或引导基金提供绩效考核的专业化平台,主要提供投资数据(投融资仪表盘:与投资趋势洞察融合)、投资绩效分析(投资绩效分析、融资日报、投资机构百强、投资人百强)、项目分析(重点项目、产业链投资、细分图谱投资)、投资布局(投资地图)、投资要素分析、投资管理等服务。