图为数据共享服务系统的界面
新华网北京1月15日电(王莹)中国科学院今日召开新闻发布会,对外发布其A类战略性先导科技专项“地球大数据科学工程”2018年度的重大成果——地球大数据共享服务平台。
记者从会上了解到,地球大数据共享服务平台是集成多领域海量数据,服务数据驱动的科学发现与决策支持的科学平台。平台以共享方式为全球用户提供系统、多元、动态、连续并具有全球唯一标识规范化的地球大数据,通过建立数据、计算与服务为一体的数据共享系统,推动形成地球科学数据共享新模式。
据地球大数据专项负责人郭华东院士介绍,目前,平台上的共享数据总量约5PB,其中对地观测数据1.8PB,生物生态数据2.6PB,大气海洋数据0.4PB,基础地理数据及地面观测数据0.2PB;地层学与古生物数据库 49万条数据记录、中国生物物种名录 360万条、微生物资源数据库42万条、组学数据目前在线10亿条。
记者从会上获悉,此次重点发布的是地球大数据共享服务平台的两个核心系统和一个区域系统,核心系统包括数据共享服务系统和CASEarth Databank系统,区域系统则为数字丝路地球大数据系统。
据郭华东院士介绍,数据共享服务系统是地球大数据专项数据资源发布及共享服务的门户窗口,是地球大数据共享服务平台核心系统之一,目前能提供5PB数据的共享服务。
在发布会现场,来自中科院空天信息研究院的何国金研究员为与会人员演示了这一系统的操作。记者得知,该系统基于专项数据特点,可提供项目分类、关键词检索、标签云过滤、数据关联推荐等多种数据发现模式,同时提供在线下载、应用程序编程接口访问等多种数据获取模式,支持可定制的多格式数据在线查看、预览和查询,并能够应对各种个性化需求,进行统计、收藏、推荐、下载和评价服务。
据何国金介绍,数据共享服务系统采用全球唯一标识,随时随地精准定位与解析,是国内首次遵照国家标准《信息技术科学数据引用》(GB/T 35294-2017)在国家重大项目数据共享平台发布数据引用,为数据有序化关联及全生命周期管理提供保障。“地球大数据专项汇交并对外发布的全部元数据,用户可以利用这个系统,根据数据共享权限进行共享服务。”何国金说。
作为平台的另一核心系统,CASEarth Databank系统则提供长时序的多源对地观测数据即得即用产品集,包括1986年中国遥感卫星地面站建设以来20万景(每景12种产品,共计240万个产品)的长时序陆地卫星数据产品,基于高分卫星1/2、资源3号卫星等国产高分辨率遥感卫星数据制作的2米分辨率动态全国一张图,利用高分卫星、陆地卫星等国内外卫星数据制作的30米分辨率动态全球一张图,以及重点区域的亚米级即得即用产品集等。
据郭华东院士介绍,该系统制定全球遥感数据产格网规范,自主研发了高效的对地观测数据引擎Databox,引入人工智能等先进技术,面向一般用户、行业用户和科学家用户,提供不同层次的对地观测数据分析与信息挖掘服务。“未来,用户不仅可以利用其数据、计算和技术来实现应用,也可以上载多源数据,嵌入算法模型,并结合系统资源来完成特定的专题信息挖掘、知识发现和融合决策。”郭华东说。
与两个核心系统不同,数字丝路地球大数据系统作为平台上的一个区域系统,包括“
一带一路”区域资源、环境、气候、灾害、遗产等专题数据集94套、自主知识产权数据产品57类、共享数据超过120万亿字节。
据郭华东院士介绍,目前,该系统已具备千万亿字节级的软硬件环境,在国际上率先研发了通用大数据平台下地球大数据提取、转换与加载工具集,实现了6大类数据的检索、共享、产品可视化展现,并通过中、英、法等多语言版本在国际相关单位实施共享。
平台上线意义何在?对此,中科院副院长张亚平在会上表示,科学数据的积累、开放、共享,已经成为世界科技发展的重要资源和推动力,中国科学院设立“地球大数据科学工程”A类战略性先导专项,致力于推动地球大数据实现从被动共享到主动共享的转变,从项目资源驱动到平台与服务驱动的转变,力争在科学数据共享及其体制机制若干关键问题上取得实质性突破,为形成良好的数据共享新生态、新局面贡献智慧力量。
对于平台今后的发展,郭华东院士表示,目前,随着硬件条件不断完善,平台数据将陆续上线,并且每年将以3PB的数据量进行更新。