应用案例Application case
数据专网助力先导专项实现海量数据高速汇交

应用背景

中国科学院A类战略性先导科技专项“地球大数据科学工程”(“地球大数据”专项)于2018年1月1日正式立项,执行期5年。专项汇集了中国科学院及国内外众多单位的优势资源,致力于构建包含资源、环境、生物、生态等多个领域的大数据与云服务共享平台,重点开展数字一带一路、全景美丽中国、生物多样性与生态安全、三维信息海洋和时空三极环境等方面的基础与应用研究,建设国际领先的数字地球科学平台,推动地球大数据领域的技术创新与地球系统科学的重大突破和科学发现,实现全方位宏观决策支持和社会公众知识传播服务,为“一带一路”、“数字中国”、人类命运共同体和联合国可持续发展目标等国内外重大战略提供科技支撑和决策支持。

地球大数据共享服务平台集成多领域海量数据,是服务数据驱动的科学发现与决策支持的科学平台。目前共享数据总量超过5PB,其中对地观测数据1.8PB,生物生态数据2.6PB,大气海洋数据0.4PB,基础地理数据及地面观测数据0.2PB;地层学与古生物数据库49万条数据记录、中国生物物种名录360万条、微生物资源数据库42万条、组学数据目前在线10亿条。

 

图片与数据来自于地球大数据科学工程数据共享服务系统网站

 

存在挑战

地球大数据专项的项目团队来自国内外多个学科领域的129家科研单位,包括空天信息创新研究院、微小卫星创新研究院、计算机网络信息中心、地理科学与资源研究所、植物研究所、海洋研究所、西北生态环境资源研究院等,参与的研究人员涵盖高性能计算、大数据技术、空间技术遥感科学、地理学、地质学、大气科学、海洋科学、生物科学、生态环境科学等多个学科领域。

地球大数据专项是典型的跨地域、跨研究所、跨学科领域的项目。专项执行过程中在海量数据远程汇交、远程在线计算、数据备份容灾以及网络安全等诸多方面存在挑战。

举例来说,如果按照以往的模式,继续使用研究所出口共享带宽来汇交数据,将会遇到流量拥塞、丢包和延时等问题,一方面无法充分利用带宽资源,另一方面,因竞争资源导致网络质量不佳,造成数据需要频繁重传(据权威测量数据显示,即使是很小的损失(远远小于1%)也足以使TCP性能降低50倍以上),严重影响数据传输效率。即使按1Gbps带宽来计算,每天最大传输的数据为10TB,若需要传输1PB的数据,则至少需要105天。因此,提高海量数据的传输速率已成为“地球大数据科学工程”急需解决的问题。

 

解决方案

针对科研领域海量数据传输需求,依托中国科技网优质网络资源,中国科技云推出了“科技云通”(http://www.cstcloud.cn/#/details?id=1206878599190155266&breadcrumb=index)服务,为用户快速构建专网,帮助用户实现高速、安全的科研大数据传输,支撑科研应用的创新发展。

了解到“地球大数据科学工程”有大数据传输的要求,根据专项的实际情况,中国科技云提出了利用光缆资源新建“CASEarth数据传输专网”整体解决方案。

通过与空天院、大气所、微生物所等专项承担单位充分讨论调研,深入了解专项数据汇交过程中的传输需求,分析各单位数据传输中遇到的瓶颈,制定切实可行的实施方案。为确保专网顺利搭建,协调沿途多个节点单位,落实光缆施工,加快建设进度,落实最后一公里接入,有力保障了专项数据汇交进度。建成的万兆数据传输专网已覆盖空天院、大气所、微生物所、计算机网络信息中心、青藏所、基因组所、文献中心等节点。此外,依托中国科技云的“统一运管平台”(http://www.cstcloud.cn/#/details?id=1207157208572235777&breadcrumb=index),服务团队快速搭建专网监控和运维系统,为专网提供7X24服务,确保了专网稳定运行。

 

 

成效与展望

通过数据传输专网建设,解决项目承担单位研究所网络出口数据传输瓶颈,对全程相关网络设备、传输终端进行优化调整,构建适合大数据传输的专享高速通道,从而显著提升大数据传输效率,保障专项数据的高速汇交与下载顺利进行。

在传输速度上,已提升10倍以上,改变了以往硬盘搬运数据的方式,根据监测,在实际使用过程中数据的最高传输速率已超6Gbps。

针对海量科研数据传输的痛点问题,中国科技云已为不同应用场景定制推出了多项特色服务,还将继续加强SD-WAN、虚拟专网和大数据传输工具等方面技术研究和应用,助力科研范式转变,为科研用户提供会用、好用和想用的产品与服务。

 

撰稿人:余宁、崔悦明