简介
服务水平协定(SLA)是在一定开销(通常这个开销是驱动提供服务质量的主要因素)下,为了保障服务的性能和可靠性,服务提供商与用户间或者服务提供商之间定义的一种双方认可的协定。它规定了服务等级和服务所必须满足的性能等级(包括服务水平测量、服务水平报告和信誉及费用3方面),并使服务提供商有责任完成这些预定的服务等级。一个完整的SLA同时是一个合法的文档,包括所涉及的当事人、协定条款所包含的应用程式和支持的服务、违约的处罚、费用和仲裁机构、政策、修改条款、报告形式和双方的义务等。同样,服务提供商也可对用户在工作负荷和资源使用方面进行规定。SLA过去主要被服务提供商用于对网路质量的保障,用来描述网路状态的典型矩阵参数,一般包括网路的可用性、丢包率和传输延时。随着电子商务的发展,SLA的功能逐步扩展至套用服务的解决方案领域,并以一种可查阅的形式提供给用户。服务提供商需要在以往工作的基础上,为用户提供端到端的SLA。
实际上,SLA的保障是以一系列服务水平目标(SLO,Service Level Object)的形式定义的。服务水平目标是一个或多个有限定服务组件的测量组合。一个SLO被实现是指那些有限定组件的测量值在限定範围内。在SLO操作时段範围内,SLO必须被实现。但是由于Internet的统计特性,我们不可能总是实现这些保障,所以SLA一般都有实现时间段和实现比例。实现比例被定义为SLA必须实现的时间与实现时段的比值。例如,在工作负荷<100transaction/sec的前提下,上午8点到下午5点服务回响时间<85ms,服务有效率>95%,在一个月内的总体实现比例>97%。
目前学术界对SLA通用的定义为:SLA是协定双方(服务提供商和客户)签订的一个契约或协定,这个契约规範了双方的商务关係、权利和义务。通常来说,SLA是在一定开销下为保障服务的性能和可靠性,服务提供商与客户之间定义的一种双方认可的协定,一个完整的SLA同时也是一个合法的文档,包括了所涉及的当事人、协定条款、违约的处罚、费用和仲裁机构、政策、修改条款、报告形式和双方的义务等,其根本目的是让合作双方在契约执行之前达成一个清晰的共同愿景,同时建立一定的机制限制各方的违规行为,鼓励双方努力达到或超过事先约定的目标。
SLA发展
SLA最早出现在1998年帧中继论坛推出其服务水平定义实施协定(即FRF13)中,该档案为帧中继业务的几个关键特性定义了可接受的参数,如帧传输延时、帧传送率、数据传送率和业务可用性(或者为正常运转时间)。FRF13除了向帧中继用户描述具体的性能和可获得的参数外,还有一个更加重要的目的,即它使帧中继提供商自信能够满足自己制定的标準,从而向其客户保证有能力提供可信赖的服务。各种各样业务提供商紧随其后,SLA产业开始萌芽。
租用线路和帧中继连线早已经有了SLA,VPN等其它业务也迅速跨入SLA的行列。
AT&T、MCI WorldCom和Sprint这三大运营商是提供SLA的先行者。AT&T目前对帧中继和ATM业务提供99.99%可用性保证,对IP业务提供99.9%的保证。MCI WorldCom对帧中继业务提供99.99%的可用性,ATM业务为99.9%,对于IP业务的可用性承诺为100%。Sprint对运行在其SONET骨干网上的帧中继、ATM和IP业务的可用性承诺为100%。
对于专线连线,Concentric Network提供100%可用性的保证(包括骨干网路和本地环路),它还保证平均往返路程时延为80ms,每月的平均丢包率不超过1%。
随着提供网际网路连线的公司如雨后春笋般涌现,SLA变得更加複杂。儘管一些提供商有服务保证,但是网际网路本身相对来说的不可预测性为这些试图提供特定的性能水平的尝试者们带来了前所未有的挑战。相信随着这一市场的成熟,许多问题将会得到解决,提供商们也会致力于解决这些问题。
AT&T可为网际网路连线服务提供保障。例如,AT&T为其AT&T WorldNet企业拨号业务提供99.9%的可用性保证,这包括AT&T管理的任何客户端设备以及从客户端设备到AT&T的POP点的连线。如果AT&T无法达到这一要求,客户根据该服务的一个月的连线费用可以获得一天的赔偿费。
总之,企业依靠SLA来获得特定的功能水平、网路频宽和正常运行时间的保证。来源于IDC公司的数据表明,在调查接受问询的大公司(拥有超过2500名雇员的公司)中约97%在未来的12个月中需要有网路的SLA,SLA是在以商务为核心的计算机环境中确保稳固的QoS、性能和正常运转时间的关键因素。IDC还预测市场对可管理和託管业务SLA的需求将从1999年的2.78亿美元增加到2004年的8.49亿美元。
SLA特点
附加性:SLA是基于IT外包商常规服务标準上所提出的性能附加需求,如可靠性、安全性、可用性等,因此SLA并不是全新的服务内容,而是一种全新的服务理念和方式。
量化性:SLA是以一个或多个业务性能指标为核心内容,并作为双方协定的标準,其定义的内容要求能够被量化表示,并对客户额外付出的费用和IT外包商承担的责任建立对应关係。
风险性:客户通过SLA将业务可能失效的风险部分地转嫁给IT外包商,外包商还需承担不具备SLA业务提供或保障能力所带来的隐形经营成本。
在具体的SLA条款中,服务提供商和客户是构成SLA的基本角色,其中客户是指基于契约关係接受服务的各种实体,包括涉及使用服务提供商提供服务的公司或组织和个人。在IT外包服务中,客户是服务的最终购买者,而用户是客户组织中的个体,并不一定是购买服务的主体。服务提供商原意特指提供电信服务的公司或组织,随着IT外包的发展,SLA中的服务提供商不仅仅局限于电信服务商,也适用于IT外包中各类的IT服务商,包括网际网路服务商、网路服务商、主机託管服务商、电脑维护商、系统集成商等,还可以是企业内部的IT部门。在整个IT服务提供的价值链中,一个SLA中的客户可能是另一个SLA中的服务提供商,同样的一个SLA中的服务提供商可能是另一个SLA中的客户,其具有传递关係。
SLA生命周期
SLA相对应的产品服务的生命周期包括五个阶段:
产品与服务开发阶段:对SLA而言,开发阶段的任务是根据客户需求引发来制定SLA模版,SLA模版既可以针对新开发的业务,也可以针对缺乏SLA或需要改进SLA的已有的业务。这一阶段的主要任务包括:明确客户需求并映射为业务特徵,设计SLA服务质量指标,根据IT外包商现有的资源状况,验证技术可行性,制定出新的SLA模版。
谈判和销售:这一阶段主要由IT外包商的商务部门和客户共同完成,也可能需要藉助技术人员的帮助,销售人员和客户将根据预定义的SLA模版,进行详尽的商谈,就SLA中质量参数指标及其违例处罚措施进行讨论和确定。
实施:即服务的提供、开通阶段,该阶段主要工作是进行业务实现方案的制定,由技术人员对服务进行端到端的SLA符合度测试,最终由客户确认服务是否满足SLA要求。
执行:在服务运行期间,双方将不断地收集服务质量数据,一方面,实时地捕获和监测SLA违例事件;另一方面,周期性地统计、分析服务质量报告。SLA的违例预警事件将引发预防性的维护工作,SLA的违例事件也将引发进入SLA违例处理流程,周期性的统计分析报告将分别传送给客户和IT外包商,面向客户的报告是针对单个客户的,而面向IT外包商的报告还将综合各类信息,为外包商进行分析和网路、业务规划提供参考数据。
评估:这里的评估指对较长时间内SLA运行情况的一个综合、深入的分析和评估,其目的是对现有SLA业务进行最佳化,同时为新SLA产品的规划提供参考依据。
客户和服务提供商的整个合作过程贯穿SLA整个生命周期,在不同的阶段需要套用到不同的SLA参数和管理方法,SLA整个管理和执行是一个反覆提高的过程,SLA的运用积极地推动了IT外包的发展进程。下一章本文将对SLA的发展历史和现状进行总结和归纳。
SLA优点
对于服务提供商SLA能够提供很多益处,它们包括:
一种使自己的服务区别于别的服务提供商的服务的方式。在过去的一年里,大多数服务提供商包括Sprint、MCI、UUNet、GTE、PSINeI等已经开始为他们的Web主机和虚拟网服务提供有效性保障。
让用户对这种服务质量与开销相挂鈎的方式有一个清楚了解。就像一种说法“快捷、便宜、优质”,你可以同时拥有其中两项。如果用户想要得到很高的服务质量,那他们就必须妥协于速率或更高的开销。如果用户愿意付更多的钱,服务提供商可以对传送的服务质量给予保障。正是这种对质量的测量及管理使服务提供商能够提供与价格相匹配的(铜牌、银牌、金牌)服务,从而吸引更多高利润的商业用户。
对用户的工作负荷和对资源利用提供一个清楚的规定。例如,对于一个Web伺服器在负荷小于8000req /min的前提下提供的性能保障是回响时问小于2s,但是如果负荷大于8000req/min时,这个保障是得不到保证。
提供给用户一种如何对服务相关问题进行诊断和解决的通用语言。
加快服务质量问题的解决从而为用户提供更好的服务。因为SLA的存在,服务提供商不得不从角户的角度出发,甚至在用户感觉到服务质量问题之前,将服务质量问题鉴别并处理,这样能够提供更好的服务。
拥有心满意足的用户。
对于用户,SLA同样提供很多益处:
用户能够对比多家服务提供商的服务质量从而选择一个价格性能的折中点。用户将SLA作为一个选择服务的提供商的工具。
把管理和维护服务传送设施的任务移交给服务提供商。作为一个企业它可以对外寻找服务设施提供商,但它仍对运作于该设施上的商业业务负责。这个选择是基于对开销和性能以及外部提供商对传送所需的QoS实现能力和对SLA遵守能力的全盘考虑之上。
为审查服务提供商的遵守情况以及在服务保障未得到满足时拥有服务商的服务能性能报表提供了条件。
SLA发展趋势
描述不详尽甚至有漏洞的SLA在网路出问题时能够保护服务提供商免受处罚,但会损害用户利益,让用户觉得受到欺骗,甚至会失去好不容易争取到的用户。以详细条款给出的SLA不但能够更好地满足用户的期望,还被认为是对用户利益负责,从而使服务提供商更具有竞争优势。
在与用户制订SLA的交流过程中,服务提供商将能更好地理解用户的要求,就服务水平达到共识,还能帮助服务提供商提供等级服务,并根据服务类别收取相应的费用。有了这些详细的信息,用户也就可以根据服务提供商实际能提供的服务和自己的预算来调整对SLA的期望。
目前,服务提供商可能还未认识到服务报告矩阵的重要性。在现有的基本SLA中,矩阵信息包括网路的可用性、网路时延及网路故障的修复时间等。这些规範在将来定义基本SLA时将被继续沿用。另外,由于网路的连线对商业终端用户越来越重要,SLA矩阵也将会根据这些用户需求进行适当修改或变动。正确的SLA管理平台使服务提供商能利用SLA矩阵的这些新特性更好地为用户服务。一个成功的服务提供商应该能开发和提供更好地反映每个用户使用连线情况的可测量矩阵。
网路开始渗入到用户商业活动的方方面面,网路的崩溃给用户所带来的损失是无法估量的,用户当然希望网路的可用性和稳定性得到保证。正是用户的这种需求促进了服务规範SLA的发展。SLA矩阵特性从原来的简单地对数据包进行计数和时延的测量开始,慢慢向与商业活动相关的SLA转变。服务提供商要对商业用户相关的SLA矩阵进行严密测量,这就需要更先进的SLA平台。提高服务提供商所提供的SLA是一个逐步过程,这个过程将为服务提供商提供一个更好地满足用户需要的机会。
大多数现有的服务水平协定契约对所有的用户都採用同一矩阵,这对特定用户来说,会出现在某一方面提供的信息太多,而在另一方面又不够的情况。因此,未来的SLA必须针对不同的用户群,让每个用户都能获得足够的有用信息。当然,对于服务提供商来说,这是有一定难度的,他们必须在理解这个难度的基础上,不断努力,从而提出让用户满意的SLA。随着SLA的提高和OSS的出现,服务提供商能够在每个SLA层中加入更详细的SLA管理特徵,使不同的SLA对用户来说变得更有价值,值得他们付出额外的费用。
对于保证一定服务水平的服务提供商,用户将会要求他们证明自己提供的服务确实达到了所定的标準。因此,在未来的SLA中,服务提供商除了为用户提供一个单纯的策略机制外,还应使用户及时了解整个网路的性能状况。这些额外的信息不但能帮助用户定位故障,迅速找出问题的原因,从而更快地解决问题,而且还有助于用户了解他们是否申请到正确的服务。
现有的SLA条款对于服务质量不能满足预定目标的情况也做出相应的规定。例如,用户有权终止协定而不受任何经济处罚、用户有权向服务提供商索取经济补偿等,用户期望能在广域网上获得与在区域网路上相同的管理水平,那些既不能满足协商好的SLA,又不能提供经济赔偿的服务提供商,是无法赢得用户的。但是,随着商业活动对网路服务依赖性的增强,用户越来越关心服务质量下降对商业活动本身造成的影响,不再仅仅满足于服务提供商为此而提供的经济赔偿,他们希望在服务崩溃时能有其它补救方法,挽救对商业活动造成的冲击。
未来的SLA提出了一个真正根据服务质量付款的概念,要求服务提供商必须满足一定的服务水平目标。如果服务提供商提供的服务质量达到预定的基本目标,用户则支付常规费用;如果服务提供商提供的服务质量达到SLA规定的较高目标,用户则为此支付一些额外开支。为了得到额外的利润,服务提供商就必须想法提高所提供服务的质量。这就需要一个可扩展性好、灵活可靠的SLA管理平台,以方便对后台系统信息进行处理。
















