导读:1月15日,首届OCP中国技术研讨会在深圳召开,本次会议是由腾讯云和OCP国际社区合办。在大会现场,腾讯专家工程师陈明刚在OCP技术研讨会上发表名为《腾讯云DWDM光交换系统设计》的演讲,以下为演讲全文。陈明刚,腾讯光网络架构师,负责开放光网络设计。研究方向主要为数据中心互联光网络的硬件解耦合、软件解耦合、光网络系统自动化。
本次分享的大纲
-
数据中心光网络面临的挑战;
-
OPC-4:开放光网络的光层设备;
-
TOOP:腾讯开放光网络平台。
数据中心光网络面临的挑战
首先讨论一下我们遇到的挑战,当前我们最大的挑战是:数据流量的快速增长!这要求我们部署越来越多的带宽。今天是互联网的时代,层出不穷的应用被创造出来,他们便捷了我们的生活,提升了效率。这些应用加工数据、产生数据,特别是一些新的、流行的移动应用在人群中传播速度非常快,随之带来的是流量的迅速增长,这要求我们必须以更快的速度部署带宽资源。
我们使用的传统光传输网络系统是供应商锁定的。我们只能从同一供应商购买电层设备、光层设备,以及网络管理系统。当我们想对一个现存光网络进行扩容的时候,我们只能从特定的供应商采购设备。此时价格、供货时间往往都会是很大的问题。即使其他供应商能够提供更便宜的产品、更好的到货时间。但对不起,此时我们别无选择,只能承受更高的扩容价格、等待更长的到货时间,因为我们的网络是供应商锁定的。这是不可理喻的,我们希望做出改变,希望我们的网络能够解除供应商锁定,希望我们花的每一分钱都物有所值。
我们同样十分关心所交付带宽的质量,每个人都希望能拥有一个永远不出故障的、稳定的系统,但是我们深知这仅仅是一个梦想,所以我们付出巨大的努力来构建针对光网络的运营维护能力。但是在推进的过程中,我们发现构建统一管理平台来管理不同厂商的传统光网络系统是一个看似美好,但是却不可能完成的任务。每一个供应商的系统都是不同的,每一个供应商的系统都是十分复杂的,每一个供应商的系统对于他们自身来说都是如此的“符合逻辑”。但是,对于我们来讲,往往仅仅是希望知道这个系统怎么了?发生了什么?如何解决所出现的问题?但是面对不同供应商的不同系统,我们的工程师完成上述工作也是十分困难的。
我们需要厂商工程师到数据中心现场协助我们处理设备的故障。我们的高级光网络运营工程师,会处理很多简单的一线事件,对这些事件的处理会经常打断他们的思路,占用他们很多的时间。而造成这样现象的原因就是不具备光网络技术背景的一线运营工程师,面对众多界面风格迥异,系统逻辑互不相同的传统光网络管理系统手足无措。这对于我们运营光网络来讲,这是一个不好的状态。我们希望推动变革,优化能力资源配置,构建更为高效的问题处理机制,有效提升光网络的运营效率。让一线工程师能够自主完成绝大部分简单的问题和事件,而不用去持续打扰二线工程师;二线工程师主要是从运营数据中分析系统存在的问题,不断的发现问题、总结问题,推动系统的快速迭代;三线工程师和研发工程师根据系统设计以及二线工程师反馈的问题,不断研发我们需要功能,将需求落地,并保证系统的持续演进。我们坚信这才是构建高效运营能力的正确道路。
综上所述,对于CAPEX,我们希望解除供应商锁定,希望我们花的每一分钱都物有所值。对于OPEX,我们希望优化能力资源配置,让正确的工程师做合适的事情,为光网络构建高效运营能力。
但是,封闭、复杂的传统光网络系统并不能帮助我们将这个梦想变为现实,因此我们需要为数据中心应用重新设计光网络硬件,我们还需要重新开发开放光网络管控系统,来有效管理不同厂商的设备,同时提供更加强大的自动化能力。
OPC-4:开放光网络的光层设备
OPC-4是我们设计的第一款专门应用在数据中心领域的光层平台子架。它有着与服务器类似的外观形态。2RU高度,440mm宽度,510mm深度,甚至要比一台2RU服务器的尺寸还小,所以它很容安装到19“机柜内。OPC-4的电源是1+1冗余的,每路电源的输入可以是110/220V的交流,-48V的直流,240V的高压直流。当它工作的时候,OPC-4会在相对较小的空间内产生热量,因此散热系统对于如此集成度高的设备是十分重要的。OPC-4采用风冷技术,我们为OPC-4设计了前进风后出风的总体气流设计,它从设备前部吸入低温空气,从设备后部排出被冷却系统加热的高温空气。OPC-4的散热方式与服务器一致,能够有效避免对数据中心整体散热气流的影响,同时能够有效避免高温废气将其他设备的吸入空气的温度提升,导致其他设备冷却异常。
OPC-4外观很像服务器,但是它并不是服务器,它极其便捷的将大容量光纤传送技术DWDM引入到了数据中心互联网络,能够有效为数据中心之间不断增长访问流量提供支撑。在我们的设计中OPC-4有4个通用的槽位,可以在任意槽位插入所需的目标板卡。我们设计了4块不同类型的板卡,使用OPC-4和这些板卡可以方便的构建5种典型的DWDM应用。我们设计了一块集成度非常高的OA(光信号放大)板卡,它集成了功率放大器(Booster),预放大器(Pre-Amplifier),光通道监控单元(OCM),光时域反射分析仪(OTDR),带外监控光通道(OSC)。这样的一块板卡便可以完成出局,入局双方向光信号的放大、监控以及针对所连接光纤的探测能力。同时我们还设计了OP(光保护)板卡,用来完成光保护相关功能;我们还设计了WSS(波长选择开关)板卡,用来完成不同方向的波长路由功能,构建针对合波信号内不同的单波信号进行功率调整的能力。通过高度集成化设计,使OPC-4具备一台设备完成一个光方向所需全部光学功能的能力,这就为光网络系统的部署提供了极大的便捷。我们的设计明显的降低了整个系统所需光纤的数量,而且每一根光纤的功能含义都十分的简单明确,这就使我们的工程师理解光网络系统更加的容易,使NOC和数据中心驻场工程师协作起来更加容易。
就只有这些了么?不!我们为简化运营做了更多的思考。我们为OPC-4的正面设计了一块屏幕,通过这个屏幕,OPC-4能够更加直接的告诉我们更多的信息。它可以直接和我们说话了,它能够告诉我们它是谁,它怎么了,特别是在数据中心里,大量长相类似的设备被规模化部署到机架上,这时候,屏幕的设计会令你耳目一新,你可以十分便捷的找到目标设备,甚至可以通过屏幕获取该设备的一些相关情况,这对于原来传统光网络设备是不可想象的。我们还为OPC-4设计了按钮,通过按钮,IDC驻场工程师可以直接在目标设备上完成操作确认等工作,而不是通过移动电话进行描述。同时OPC-4面板、板卡上的LED指示灯也是远程可控的,它可以根据控制器的指令进行颜色的变化、闪烁等动作,以对IDC驻场工程师起到提示作用,使NOC和现场的协作更加顺畅。屏幕、按钮和可控LED灯的设计,为NOC和IDC驻场工程师的协作方式创新奠定了基础。
OPC-4是为数据中心应用设计的光层设备、它易于运维,同时OPC-4天生是开放光层系统,它完全实现了电层系统和光层系统的解耦合。基于OPC-4我们解除了供应商锁定,我们可以选择任何我们认为更好的设备,而不再为供应商锁定而苦恼。同时,对于硬件系统,我们将原本一个打包封装的系统分拆了成了两个不同的子系统,这就为两个不同的子系统独立进行技术演进奠定了基础。电层系统和光层系统具备不同的技术发展速度,电层系统在技术演进方面具备更快的步伐,因为我们知道DSP等电层芯片的技术演进符合摩尔定律,但是光放大器,WSS以及其他的有源,无源光器件的技术演进步伐要慢的多,因为这些器件的更新换代往往依靠于基础理论的突破和更加优秀材料的发现。
OPC-4是为数据中心应用设计的光层设备、它易于运维,能够高效构建开放光层系统,同时我们定义OPC-4为光网络的“超级传感器”,来帮助我们从光网络收集数据。我们让OPC-4具备streaming telemetry功能。对于一条数据业务,有高达97个数据侦测点,性能数据、状态数据、告警数据源源不断的从OPC-4发送出来,所有这些实时数据帮助我们精确掌控光网络的运行状态,为光网络的自动化奠定了基础。同时我们也在持续增加更多的对高效运营有帮助的检测点,不断的将这个功能做的更好。OPC-4设备的数据模型是基于Open-Config构建的,针对我们的定制设备和所定义的双向系统模型,我们对Open-Config模型进行了修改和扩展。十分感谢Open-Config这一出色的开源模型,帮助我们能够快速构建数据导向的光网络系统模型。
TOOP:Tencent Open Optical Platform
让我们再来聊一聊TOOP(Tencent OpenOptical Platform)腾讯开放光网络平台,TOOP是基于OPC-4构建的,是腾讯的新一代光网络系统。TOOP的概念来自于高速公路,光纤类比于道路,是整个系统的基础,我们见到过不同类型的道路,同样对于光网络系统也可以使用不同类型的光纤。对于最简单的应用,不同的汽车可以直接开到道路上行驶,同样光信号也可以直接馈入光纤进行传输,但是此时光信号并不能传输很远的距离,就像你在一条漆黑的山区小径上驾驶,没有路灯、没有交通指示牌,你只能放慢速度,但这并不是高速公路。为了提升道路的容量,一种方法是拓宽道路,或者新修建另外一条公路;另外一种方法是提升道路上汽车的运行速度。毋庸置疑更好的发动机是需要的,但是对于道路本身,更强监控和控制能力是保证路网通过能力的基石,它能够使更多的汽车,更加有序的运行在更高的速度上。对于光网络也是一样的,我们需要更强监控和控制能力来提升我们光传输网络的自动化水平。我们正在竭尽全力构建光网络网络的自动化运营能力。我们的目标是构建一个高度自动化、十分友好的光网络系统,我们愿意与任何对这一方向感兴趣的伙伴进行讨论和合作。
我们坚信TOOP的未来是光明的。我们也在持续推进TOOP继续演进,今年我们将为数据中心应用设计一款电层设备,目前针对该设备的设计工作已经开始,我们已经和一些合作伙伴进行讨论,我们欢迎更多的朋友能够加入进来。同时我们将从网络中获得更多的数据,我们将会在运营自动化的方面进行跟多的尝试,我们也欢迎任何对光网络自动化、网络数据分析感兴趣的伙伴与我们一起协作,让我们一起把一些很棒的想法变成现实。我们希望与更多的朋友、更加深入的合作,加速腾讯光网络的迭代,将TOOP做的更好。
OCP在撬动行业创新方面独具一帜,OCP是我们加速光网络创新的阳光大道,相信与OCP紧密配合能够更快的帮助我们实现这一目标。让我们一起努力,让我们的工作惠及更多的网络。谢谢!
后台回复“DWDM”,获取本次演讲的完整PDF。