空间数据智能：概念、技术与挑战- 工业快报

相关阅读：

近日，一个由南方科技大学、浙江大学、清华大学、中国地质大学（武汉）、中国人民大学等科研人员组成的联合研究小组，阐述了空间数据智能的概念、所面临的技术挑战及关键技术，介绍了空间数据智能在社会生活中的典型应用场景，并对空间数据智能研究的发展做出了展望。相关研究成果以《空间数据智能：概念、技术与挑战》为题发表于《计算机研究与发展》2022年第2期。

　　空间数据是描述自然地理空间和人类活动空间所包含的人、物体、事件的信息。通常来说，空间数据具有空间位置信息、时间信息和属性信息。与土地一样，具有空间位置信息的空间数据是一个国家拥有的具有战略意义的重要资源。我国幅员辽阔、人口众多，加上这十多年来快速发展的数字化建设，空间数据的现有量级十分巨大。伴随着各类传感器和全球定位系统的更加广泛使用，诸如遥感数据、地图测绘、交通轨迹数据、手机信令数据、APP打卡数据等空间数据将持续增长，并带来巨大的价值。

　　面对海量异构的空间数据，传统的数据感知存储技术和处理分析方法已然不能充分挖掘海量空间数据的价值，这正是空间数据智能逐渐兴起的原因。

　　空间数据智能是利用先进通信技术、人工智能方法、大数据分析、先进计算机技术等技术方法对空间数据进行更好地感知、采集、分享、管理、分析及应用的一个多学科交叉的研究领域。空间数据智能旨在通过相关理论和技术的突破，充分释放空间数据的潜在价值，让海量空间数据赋能于各行各业，服务于我国经济社会的发展。

一、空间数据智能的技术挑战

　　空间数据的持续增长对于空间数据智能而言，既是机遇又伴随挑战。空间数据智能所面临的主要挑战包括数据感知、数据分析处理、数据应用、数据隐私与安全、高精度地图等方面。

二、空间数据智能的关键技术

（一）时空数据库

　　时空数据库旨在存储与管理同时具备时间和空间属性的时空数据。时空数据是包含对象、过程、事件及其在空间、时间、语义等方面的关联关系。例如，对于移动物体，其在移动过程中产生的轨迹数据就属于时空数据。因此，时空数据库可以捕捉具有空间参考的移动对象的运动变化，即通过增加时间维度，将原先的空间数据模型扩展为时空数据模型，并为时空数据提供高性能的读写和计算服务。根据时空数据库的存储和计算特点，时空数据库可以分为分布式时空数据库、AI赋能时空数据库、新型硬件时空数据库等。

（二）空间感知技术和时空数据挖掘

　　空间信息的感知依赖于传感器技术和网络技术，是空间数据智能的神经末梢。然而现实世界是复杂多变的，因此需要可靠的、泛在的、实时更新的感知层收集可靠的时空信息。空间感知技术可从传输网络和接口来分类，根据网络范围主要分为卫星网、互联网、物联网和无线传感网技术。

（三）时空数据安全与隐私

　　为了更好地保障用户对其个人数据的使用知情权和处理权，欧洲政府于2018年出台了用户隐私保护政策《通用数据保护条例》（GDPR）。中国在３年后也颁布了《中华人民共和国数据安全法》，加快填补国内数据安全保护的空白。其中，由于时空数据可以用于城市规划、智能交通和商业分析等应用，并且往往涉及到公共事件、政策等方面的敏感信息，因此保障时空数据的安全与隐私更是对维护国家安全有重要意义。在城市发展的过程中，依据空间数据的时空特性，我们认为在数据采集、数据处理和数据发布３个阶段有不同的隐私保护要求。

三、空间数据智能的典型应用场景

　　空间数据智能将在城市交通应用、城市防灾应急、传染病防疫、国土空间规划、智慧能源等方面发挥应用，以下重点介绍在智能能源领域的应用。

　　为实现“碳达峰”和“碳中和”的目标，“十四五”期间我国将加快能源数字化转型，建设清洁低碳、安全高效的现代智慧零碳能源体系。空间数据智能技术通过利用物联网、云计算、大数据、人工智能和5G等技术，可以实时感知能源领域的时空信息，集成多种能源（电、煤、石油、天然气、供冷、供热等）的生产、传输、存储、消费、交易等时空数据于一体，建立能源体系的数字底座，实现风光储一体化、石油管道运输规划、电力供应、绿色能源交易、用户需求预测等能源全生命周期管理环节的价值挖掘和分析，构建能源价值的一体化智能服务平台。

　　空间数据智能技术可以大大提升能源领域的数字化、自动化和智能化，做到零碳能源智能生产，实现能源的脱碳生产和清洁利用；建立分布式智慧能源网络，提高能源的传输和利用效率；同时实现多能协同供应与调度管理，充分发挥多种能源相互配合使用的优势。除此之外，空间数据智能技术还可以提供能源的智能交易服务，实时高效地满足供需侧的多样化需求；打造低碳车联网能源服务，促进新能源汽车的快速发展，减少道路交通的碳排放和空气污染；同时提供一站式园区智慧能源服务，降低园区能耗强度和碳排放强度。因此，空间数据智能技术能够全面助力能源的数字化转型，加快双碳目标的实现。

四、空间数据智能未来展望

（一）多模态数据融合和数据库的易用性

　　随着5G和物联网技术的快速发展、以及时空应用场景的不断变化，时空数据库在不断发展的同时，也面临了诸多亟需解决的挑战性难题，如多模态数据融合。真实世界中时空数据除了时间序列和地理位置数据外，还存在大量具有时空属性的多模态数据，如GPS文本、运动图像、交通视频等，如何在现有时空数据库中融合具有时空属性的多模态数据，以支持多模态时空数据融合处理，是时空数据库领域面临的新挑战。

　　此外，随着以博客、社交网络、基于位置的服务等为代表的新型信息发布方式的不断涌现，以及云计算、物联网技术的不断发展，高精尖的数据库技术逐渐进入人们的视野，并帮助一般用户进行感知和决策。然而，用户并不精通数据库专业技术，但仍然需要对许多事务进行决策，因此需要高可用、易懂易用的数据库。“数据库平民化”已经成为数据库未来发展的一大趋势，如何利用即时查询、查询构造等提升时空数据库易用性是时空数据库领域面对的又一新挑战。

（二）新一代时空数据数据挖掘算法

　　随着移动智能设备和移动通信技术的快速发展，空间数据的采集变得日益普遍，使得大规模空间数据在医疗、能源、交通等领域具有重要应用价值，然而与空间大数据相匹配的信息处理、知识提取算法仍是亟待研究的领域。此外，人工智能和数据挖掘算法在近十余年来取得了长足的发展，我国也在近年提出了促进人工智能和大数据国家战略，指出人工智能和数据挖掘技术将成为发展国民经济水平各领域的重要抓手。在空间数据智能研究中，如何有效地实现空间大数据和人工智能研究的深度融合、再创新是重要的未来发展方向。然而，在空间数据智能中，应用并发展人工智能和数据挖掘技术也存在以下几点重要问题：

　　首先，空间数据往往体量巨大且结构异质，这对发展、应用的人工智能模型的计算效率、空间复杂度和可并行度等性能指标提出了很高要求。

　　其次，空间大数据由于物体在空间上重叠、包含等原因，往往缺乏也难以获取高质量数据标签。这使得现有算法模型大部分局限在非监督学习、弱监督学习范式下，难以从大规模无标签空间数据中提取出高质量知识。

　　此外，空间大数据由于获取渠道多元、大规模感知设备的精度低等原因，存在数据质量差、单位数据价值密度低等问题。空间数据噪音在很大程度上受定位设备的影响，如GPS、蜂窝基站、WIFI热点等，且不同数据渠道采集的数据存在较大差异，难以有效融合。

　　因此，在空间数据智能中设计数据挖掘和人工智能算法需要有效解决对数据质量的兼容性问题，从而实现稳健的空间知识提取。

（三）时空复杂性与复杂系统

　　随着社会分工的不断深入，快速的城市化是过去数十年中贯穿我国和世界各国的主旋律。空间上的聚集和由信息技术发展带来的高频社交行为，使得复杂系统成为了研究人类社会及相关问题的必要范式。

　　在此背景下，人的行为模式在不同空间尺度下表现出完全不同的复杂行为模式。以交通规划领域为例，其在个体层面关注于出发地目的地（O－D）的建模，在聚合层面要建道路截面流量，而在城市区域层面则要关注宏观人群流动规律。复杂系统的内在特性使得微观机制和宏观规律间存在难以预测的非线性效应，这位多尺度的空间数据智能研究提出了独特的挑战。

　　现有复杂系统研究主要采用演绎的研究方法，即基于一系列预设的微观机制推到、仿真宏观的行为规律。然而，这一研究范式无法有效利用日益丰富的空间数据，无法实现数据驱动的规律发现和知识获取。另一方面，单纯的数据挖掘算法无法有效地和已有复杂系统理论相结合，挖掘出的观测规律在理论完备性和可泛化能力上存在隐患。因此，空间数据智能的未来研究中，一个重要方向是提出能有效结合复杂系统理论与空间大数据的新研究范式，并且解决其在社会各领域的有效应用。

（四）可解释的时空关系建模

　　近年来，机器学习领域取得了蓬勃发展，对于现有的机器学习方法来说，单纯追求预测精度是不够的，这类模型具有一个共同的特点，内部结构复杂，运行机制像一个黑盒子一样。且大多数预测模型根据相关性进行预测，但相关性并不意味着因果关系，模型输出结果也难以得到有效解释。因此，在未来，正确性和可解释性成为了机器学习特别是深度学习要实现的目标。

　　深度学习领域尝试开展具有可解释和分析能力的关系模型，这些模型的一致目标是探究能否找到一个原因，来对模型结果进行针对性的解释以及可靠的指导。因此，深度学习开始结合一些因果发现与因果推断方法，例如因果图、结构因果模型等，通过对观测的时空数据进行分析来揭示隐藏的因果信息。因果分析也是快速发展的可解释人工智能领域的一个重要课题，旨在构建可解释和透明的算法，解释如何做出决定。从以往研究来看，因果关系已经在无数领域和场景下得到学习，包括教育、医学、经济学、流行病学、气象学和环境健康等。

　　因果学习与机器学习领域有着密切的关系。机器学习领域的蓬勃发展促进了因果发现和因果推断领域的研究与探讨。例如，应用决策树、集成方法、深度神经网络等强大的机器学习方法，可以更准确地估计潜在的结果。因果学习是解释分析的强大建模工具，它可以使当前的机器学习做出可解释的预测。因此，如何更进一步将因果学习与机器学习连接起来，克服认识上的不透明性，从相关性最终获得因果性，是未来需要解决的难题。随着数字传感技术的进步与发展，以及时空数据库的不断丰富，发展具有因果关系挖掘能力的模型或许是破解黑箱模型的关键。

引用格式：宋轩, 高云君, 李勇, 等. 空间数据智能：概念、技术与挑战[J]. 计算机研究与发展, 2022, 59(2): 255-263.

原文链接

　　责任编辑：宫在芹

文章内容来自网络，如有侵权，联系删除、联系电话：023-85238885