加快我国大数据技术创新发展着力打造产业高地优势——《“十四五”大数据产业发展规

编者按:2021年11月30日,工业和信息化部发布了《“十四五”大数据产业发展规划》,中国电子报约请相关行业专家对《“十四五”大数据产业发展规划》进行深度解读,敬请期待。本期为清华大学大数据系统软件国家工程研究中心总工程师王晨,清华大学软件学院院长王建民,中国工程院院士、清华大学大数据系统软件国家工程研究中心主任孙家广对《“十四五”大数据产业发展规划》的解读。

随着第四次工业革命的深入展开,大数据日渐成为宝贵的战略资源,成为了推动产业数字化、网络化、智能化发展的关键生产要素。为此,应坚决贯彻习近平总书记对科技创新“四个面向”的战略部署,以创新驱动发展和自主安全可控为使命,以国家《“十四五”大数据产业发展规划》为指导,推动自主技术发展,激发数据要素潜能,积极促进大数据应用落地,形成我国大数据产业面向高端供给能力,推动我国大数据产业高质量发展。

加快发展自主大数据系统软件技术体系,打造高端产品链

近年来,随着新一代信息技术的高速发展,大数据技术日新月异,新概念、新技术、新架构层出不穷,技术和产品迭代速度明显加快。国际上,以Hadoop、Spark、Flink等为代表的大数据系统软件,依托Apache等国际开源社区,其开放性使得技术与产业生态均得到了快速的发展。

我国在大数据领域的布局较早,无论是政府还是民间都投入巨大,在企业、高校、研究机构等各方的共同努力下,我国大数据技术和产品取得了长足的进步。但是与国外相比仍然存在着一定的差距,系统软件层面的核心技术和产品虽然不存在“卡脖子”的情况,但依然无法避免核心代码依赖国外开源大数据软件的问题,对开源社区及其技术的发展方向缺乏控制力,开源创新不足业已成为制约我国大数据产业发展的瓶颈。

针对我国大数据产业创新不足的问题,应面向世界科技前沿,从大规模多源异构数据一体化管理、交互式异构数据分析框架、数据可视化与智能数据工程等多方面开展技术研发和工程化,研发一系列基于自主技术的国际领先的大数据核心技术与产品,突破创新驱动产业升级转型以及关键领域自主可控中的技术瓶颈,着力打造自主可控的大数据技术体系,建设国际一流、开放协同的产学研用大数据技术创新团队,增强对国家重大战略方向、重点工程的大数据系统软件保障能力。

与此同时,面向全球化、开放化、开源化的大数据技术发展态势,积极鼓励我国大数据技术企业“走出去”,通过广泛参与、领导国际开源项目、海外企业并购等方式,加强技术话语权与领导力,形成一批我国主导的大数据开源项目,培养一批具有世界级影响力的大数据技术人才。鼓励我国大数据技术企业积极拥抱开源软件“订阅”模式、云服务模式等新兴业务形态,低成本、高效率的开拓海外市场,推动我国自主的大数据产品扬帆出海。

推动大数据技术在各行业深化应用,优化行业价值链

我国大数据与产业的深度融合仍然不足。一方面,我国大数据软件产品在实体经济领域的技术成熟度和易用性距离实际场景下的应用要求仍有差距,总体发展水平滞后于企业的需求和应用水平,多数企业仍然依靠第三方公司来进行大数据平台的管理和大数据应用的开发;另一方面,企业对自主大数据产品的带动孵化缺位,大胆尝试创新仍然不足,应用的深度和广度明显不够,供需互促的良好发展格局仍有待形成。

为此,应围绕工业互联网等国家战略,着力我国实体经济发展需求,瞄准国家重大战略需求,努力为国家战略任务和重点工程实施做出贡献。以工业企业为主体,面向航空航天、船舶、电子、石化等重点行业,充分发挥龙头企业的“链主”作用,依托重大工程研发任务,面向数字化和智能化的实际需求,组织产学研用各方力量,多创新主体共同参与,联合研究、共同开发,研制行业/专业领域国际领先的大数据应用产品,探索大数据应用实施工程方法,将实际需求和技术溢出转化为现实导向和目标,加速推动企业数字化转型与高质量发展。

突出需求侧和供给侧之间的良性互动,加速推动企业形成的先进技术创新成果向大数据系统与平台软件开发企业的溢出,创新供需双侧融合驱动的技术攻关与产品协同发展模式。一款好的大数据产品是“用出来的”,支持和鼓励企业试用、使用国产大数据产品,实现产业需求带动技术发展和技术发展促进企业革新的双向正反馈,在使用过程中逐渐迭代完善国产产品。扩大试点示范项目,促进优秀产品的推广应用,实现大数据产品的质量提升,并带动传统产业转型升级。

构建开放融合的开源社区,推进大数据技术创新

平台级的大数据系统软件技术与产品,在大数据产业的价值分布中位于核心地位,其范围涵盖数据采集、存储、治理、分析的数据全生命周期,与行业大数据应用相比技术难度大、开发周期长、商业回报率低,企业自主研发投入大,因此我国现有的大数据系统软件产品大量采用国外的开源技术,但反之对于开源软件的贡献相对不足。

开源具有天生的“开放基因”,凭借其开放性、灵活性、低成本和技术创新性等特点而迅速走向成熟,逐步发展成为一种主流模式,成为软件多源化的重要来源之一,日益改变着信息产业和大数据产业的发展轨迹。开源是解决我国大数据技术瓶颈的有效途径,通过大数据开源社区建设,构建自主大数据开源社区及支撑平台,形成良好的运营机制,孵化由我国主导的大数据开源项目,同时鼓励将各类专项成果汇聚到开源社区之中,通过开源的方式向全社会共享,强化“产学研用”深度融合,引导构建自主可控的大数据生态,解除桎梏和枷锁,实现我国大数据技术和产业从“并跑”向“领跑”的跃进。

为此,应通过建立大数据开源生态社区,将关键技术以开源的方式对社会免费开放使用,快速触达真实用户形成社区,从而获得有价值的反馈,吸引高水平开发人才加入共同研发,保证大数据系统软件的开发朝着代表广大用户真实需求的方向迭代发展,形成正向反馈,逐步产生示范效应扩大用户群体,吸引更多高水平的伙伴深层次合作,从而促进形成国内一流的产业环境。

培养和汇聚大数据系统软件高端技术人才,并主动承担国家和行业重大科研项目,取得一批关键技术成果并成功转化,构建大数据领域自主知识产权体系,形成可持续的产学研协同创新机制,为推动我国大数据的技术进步和产业发展提供技术支撑。

加速大数据标准与测评体系建设,实现标准引领

我国大数据相关标准仍有较多缺失,亟需通过标准引领和规范大数据技术与产品的发展。从标准类别分布看,平台/工具及行业应用类标准化需求最为旺盛,与我国大数据产业应用场景多、应用模式丰富等特点相一致。从标准研制路径看,标准化工作重心逐渐由基础类标准、数据类标准向平台/工具类标准、治理与管理类标准转移,由通用领域标准向垂直应用领域标准延伸。从新增标准化需求看,标准需求从通用应用系统向场景化应用系统转变(如图数据库系统、批流融合计算系统)。

围绕DCMM的工作推进,治理与管理类标准,面向产业供需双方需要,标准化方向主要覆盖数据治理、数据服务、数据资产评估等领域,大数据治理标准体系初现雏形,需要结合后续评估工作不断优化完善。行业应用类标准,持续重点关注工业大数据标准化,在生态环境、电力等垂直应用领域也提出了数据体系、数据分类等标准需求,数字化转型支撑相关标准化预研工作逐步开展。围绕“十四五”大数据国家标准,要不断夯实大数据标准体系建设,加快重点领域标准研制,健全标准符合性评测体系,推进国际标准化工作。

另外,我国大数据产业发展的公共服务能力和综合保障能力仍然不强。目前我国缺少统一的评测机构开展对大数据软件的评价工作,开发企业在软件测评和用户企业在软件选型时缺乏第三方测评机构的评估和认证支撑。应搭建由多方参与的测试验证平台和安全保障平台,通过统一科学的标准和专业的测试环境,对大数据软件产品的质量和安全性等进行独立客观的测试、验证和评价,其结果可为企业的选型和应用提供指导。同时,应不断提升综合保障能力,为大数据产业提供政策引导、知识产权保护、数据资产保护等服务。


作者丨清华大学大数据系统软件国家工程研究中心总工程师 王晨

清华大学软件学院院长 王建民

中国工程院院士、清华大学大数据系统软件国家工程研究中心主任 孙家广

文章内容来自网络,如有侵权,联系删除、联系电话:023-85238885

参与评论

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

评论区