iSlot官方网站

无线新履历,不变如磐石 丨 高校关键场景高密无线优良实际分享会
date
预约直播
从此,无线可“磐石" 丨 iSlot官方网站磐石无线解决规划场景颁布会
date
预约直播
iSlot官方网站 - 引领潮水
产品
< 返回主菜单
产品中心
产品
解决规划
< 返回主菜单
解决规划中心
行业
合作同伴
返回主菜单
选择区域/说话
iSlot官方网站 - 引领潮水

您订阅的产品有更新,请实时查阅

查看详情
iSlot官方网站 - 引领潮水 iSlot官方网站 - 引领潮水

RGAC高可用群集技术白皮书

RGAC高可用群集技术是一种提供高可用性、改善机能和加强利用软件可治理性的有效蹊径。随着IT运营治理的规范,系统安全和沉要性的日益增长,集群技术必将会有着极为辽阔的利用远景。

  • iSlot官方网站 - 引领潮水

    颁布功夫:2009-11-04

  • iSlot官方网站 - 引领潮水

    点击量:

  • iSlot官方网站 - 引领潮水

    点赞:

分享至

iSlot官方网站 - 引领潮水
iSlot官方网站 - 引领潮水
iSlot官方网站 - 引领潮水

我想评论

发展趋向以及面对的挑战
 

    随着推算机在社会各个领域的宽泛使用,人们已习惯于推算机系统带来的便捷和高效能,但推算机系统也极度脆弱,它会受各类成分的影响,如硬件系统自身的故障,电源故障,病毒,天然灾害或报答的恶意粉碎,城市导致系统无法正常运行。现有好多系统均是单主机工作环境,任何一个单点故障,城市影响IT运维业务的正常运行,并且产生好多不良后果。
 

    在高校校园数字化校园治理中,主题的业务利用系统越来越多,这些系统都是关系到高校治理的主题业务,如:财政系统、办公系统、精品课程系统、安全治理认证系统等,尤其是安全治理认证系统,这个系统是管控所有上网用户的最根基的主题系统,是所有高质量网络服务的基础,高不变和高机能从来是高校网络中心治理者的首要思考的问题。
不能不变运行和低机能的系统常导致
 

    1. 用户中意度极度极差,从而影响用户的使用感触,极大的降低了用户对网络中心信赖和依赖;
 

    2. IT部门接受极大的压力,一方面要保障系统的不变性,另一方面,系统一旦出现故障,必须在尽可能短的功夫内让系统再次运行,但这往往又无法保障的;
 

    3. 可能导致数据的不齐全和不一致,甚至部门数据的迷失,尤其在大规模数据利用环境中尤为凸起;
 

    4. 当业务大量增长时,用户使用系统机能严沉降落,但是用户不以为是由于业务大量拓展导致的,而是以为网络中心提供的服务质量不好造成的;
以上这些问题频仍若是出现,则会引起高校辅导对网络中心服务的不信赖,从而可能促使高校辅导思考网络中心业务表包,所以解决网络治理的不变和扩大性已成为网络运维治理的沉要工作。
 

 

2 技术布景
 

2.1 负载平衡
 

    在推算机硬件价值降落和推算机网络拓扑发展的情况下。散布式推算机系统给用户提供了一个丰硕的资源集中。人们在钻研散布式系统时就把稳到这样一个问题:在一个由网络衔接起来的多推算机环境中,在某一时刻。一些推算机的负载过沉。而另表一些推算机的负载较轻,平衡各推算机之间的负载是工作分配与调度的一个重要指标。它可能提高整个系统的机能。
 

    为了改善系统的机能,通过在多台推算机之间合理地分配负载,使各台推算机的负载根基达到平衡,这种推算能力共享的大局通常被称为负载平衡或负载共享。
 

    负载平衡成立在现有网络结构之上,它提供了一种廉价有效的步骤扩大服务器带宽和增长吞吐量,加强网络数据处置能力,提高网络的矫捷性和可用性。
 

    现代负载平衡技术通常操作于网络的第四层或第七层。负载平衡器能够凭据现实的响应功夫造订优先级交付决策,从而实现高机能、智能化流量治理,达到最佳的服务器群机能。选取第七层利用节造还能够削减通讯顶峰期的谬误信息,由于差错节造和流量治理技术能够侦测到一些谬误信息并通明地将会话沉定向到另一个服务器,使用户顺利地进行使用。
 

    由于选取了负载平衡技术,自动故障复原得以实现,服务的功夫能够耽搁,24×7靠得住性和持续运行成为可能。另表,负载平衡器通常也支持蹊径表返回模式,即绕过流量分配器,为那些焦心期待大量数据文件要求响应的客户提供更快的响应功夫。
 

    在最新的负载平衡产品中,智能化越来越显著。一些智能化的负载平衡器可能侦测到像数据库谬误、服务器不成用等信息,从而采取措施使会话复原和沉定向服务器使电子商务可能得以顺利进行。多址负载平衡器能够对客户发来的接见要求进行解析,推算出最佳地址,而后将该地址返回客户,使客户自动衔接到对其要求来说最佳的数据中心。
 

    负载平衡,从结构上分为本地负载平衡和地域负载平衡(全局负载平衡),前一种是指对本地的服务器集群做负载平衡,后一种是指对别离搁置在分歧的地理地位、在分歧的网络及服务器群集之间作负载平衡。
 

2.2 群集服务
 

    服务器群集是一组协同工作并运行群集服务的独立服务器。服务器群集为资源和利用法式提供高可用性、故障复原、可伸缩性和可治理性。服务器群集允许客户端在出现故障和打算中的暂停时,依然可能接见利用法式和资源。若是群集中的某一台服务器由于故障或守护必要而无法使用,资源和利用法式将转移到可用的群集节点上。
 

    群集服务能够对利用法式和资源进行监控,并可能自动鉴别和复原多多故障情况。这为在群集中治理工作负荷提供了矫捷性。另表,还提高了整个系统的可用性。
 

    集群技术是一种通用的技术,其主张是为相识决单机运算能力的不及、IO能力的不及、提高服务的靠得住性、获得规?衫┐竽芰,降低整体规划的运维成本(运杏注升级、守护成本)。只有在其他技术不能达到以上的主张,或者固然可能达到以上的主张,但是成本过高的情况下,就能够思考选取集群技术。
 

选取群集技术能够获得以下利益:
 

   高可用性:通过服务器群集,资源(例如:磁盘驱动器和Internet和谈(IP)地址)的所有权会自动从故障服务器转移到可用的服务器。当群集中的某个系统或利用法式产生故障时,群集软件会在可用的服务器上沉新启动故障利用法式,或者将工作从故障节点分散到剩下的节点上。由此,用户只在瞬间感触到服务的暂停。
 

   故障复原:当故障服务器沉新回到其预约的首选所有者的联机状态时,群集服务将自动在群集中沉新分配工作负荷。该个性可配置,但默认禁用。预防了网络关键部位出现单点失效。
 

   可治理性:您能够使用“群集治理器”工具(CluAdmin.exe),将群集作为一个单一的系统进行治理,并对犹如运行于一个单一服务器的利用法式执行治理。您能够将利用法式转移到群集中的其它服务器。“群集治理器”可用于手动平衡服务器的工作负荷,并针对打算守护开释服务器。您还能够监控群集的状态、所有节点以及来自网络任何处所的资源。
 

   可伸缩性:群集服务可扩大以满足需要的增长。当群集监督利用法式的总体负荷超出了群集的能力领域时,能够增长附加的节点,解决网络拥塞问题,服务就近提供,实现地理地位无关性。
 

3 技术个性介绍
 

3.1 技术概述
 

    高可用的群集技术不只能够有效地解决单服务器的机能限度,并且能够实现故障的急剧转移,保障服务的高可用性以及矫捷的扩大性。RGAC(即:RG Application Cluster——iSlot官方网站利用群集,下同)规划很好地利用了这一技术,由多台服务器以对称的方式组成一个服务器集中,每台服务器都拥有等价的职位,都能够单独对表提供服务而毋庸其他服务器的辅助。通过某种负载平衡技术,将表部发送来的要求均匀分配到对称结构中的某一台服务器上,而接管到要求的服务器独立地回应客户的要求。这种技术能够用至少的投资获得靠近于大型主机的机能。
 

    同时,RGAC规划整合了数据库的事务复造职能,并针对SAM系统提供的服务,自主进行了研发,达到多台服务器之间的信息同步,在客户的眼里,SAM系统只有一个,但它所提供的服务,较之单台,越发快捷,也越发不变!
 


3.1.1 NLB

 

    Windows server系统(Windows 2000高级服务器版本、Windows server 2003所有版本)中提供了NLB(即:Network Load Balancing——网络负载平衡,下同)职能。
NLB技术蕴含两大特点:负载平衡和故障转移。
 

1. 负载平衡
 

    NLB能将传入的要求传布到多达32台服务器上,即最多能够使用32台服务器组成一个集群,共同分管对表的网络要求服务。该技术保障即便是在负载很沉的情况下,服务器也能做出急剧响应。
 

    网络负载平衡对表只需提供一个IP地址,即集群IP,客户端使用这个IP即可接见集群。所有的服务器上使用一样的规定,来决定并发的流量被分配到哪一台上进行处置,从而很大水平上提高了服务器的处置能力。
 

2. 故障转移
 

    NLB第二个壮大的个性是故障转移。集群内每台服务器靠按时发送心跳信息来估定其它服务器的状态。当有一台或几台服务器不成用时,服务不会中断,可能迅速在渣滓的服务器中沉新指派服务器收受过来,从而对用户是一向可用的,这个过程叫做“聚合”。这项个性可能保险服务被不间断地提供。
 

3.1.2 信息同步
 

RGAC规划提供了信息同步职能。
 

    举个例子,系统中有两台设置了NLB的认证服务器A、B,各对应数据库C、D。一个用户提议增长500个用户的要求,这个要求被NLB分配到服务器A进行处置,数据库C的用户表中也随之增长这500个用户。但对于要求被分配到服务器B处置的用户来说,服务器B上并没有这新增的500个用户,那么,用户得到的信息就不一致了。分歧的用户,分歧的操作,得到的了局可能分歧。
 

    在RGAC规划中,通过SQL SERVER数据库事务复造和内存同步来解决信息同步的问题。在上面的例子中,数据库C在增长了用户信息后,会把这一变动同步到数据库D上,对于要求被分配到服务器B处置的用户来说,服务器B上也有新增用户的信息。这样所有的SAM服务器的信息就是同步一致的。
 

3.2 群集技术在SAM各业务?榈睦
 

3.2.1 报文交互过程
 

    对于SAM来说,来自表部的要求有如下几风雅面:
 

   Radius有关认证,记账要求报文
 

   Web治理端http要求/https要求
 

   Web自主端http要求/https要求
 

   和互换机之间的SNMP报文交互
 

   和互换机之间的TRAP报文交互
 

   和NTD之间的IPFIX报文交互
 

   和第三方系统之间的JMS新闻通讯
 

   发送EMAIL的pop3通讯
 

这些报文交互涉及到的SAM职能极度宽泛,各个?槎加兄澳苌婕。
 

3.2.2 技术框架
 

系统(NTD,互换机,路由器等)和SAM之间的在NLB的前提下交互过程。

 

    报文传输过程中,涉及到2种流量,HTTP和HTTPS的,NLB是基于IP包的源IP的负载平衡,正常情况下并不会出现什么问题,统一个源IP的HTTP或者HTTPS要求都是如上所述的交互方式。
 

    如图3-2所示,在正常运行情况下,任何一个固定client都只会和NLB中某台服务器进行交互,并且鄙人次要求过程中依然维持这种1对1的对应关系。对于单纯的http和https交互不会出现什么问题。
 

    但必要思考的是在出现单点故障时,会受到影响的参数重要思考如下2点:Session、Cookies。
 

1. 由于Session产生的影响
 

    如果SAM S2出现单点故障时,NLB自动把Client A的http要求发送给SAM S3,若是在SAM S2出现单点故障之前Client A已经在SAM S2上登陆(目前做法是把用户的信息保留到session中),则鄙人次http要求到SAM S3之后,会出现SAM S3让Client A沉新登陆认证的情况,由于SAM S2的session信息并没有转移到SAM S3上。当SAM S2复原后,若是NLB自动又把Client A的要求发给SAM S2,则必要看S2上面的session是否已经过期(功夫过期或者系统沉启导致被清空),若是过期则依然必要进行沉新登陆,并且至少在SAM S3中存入Session的有关信息也迷失了。
 

2. 由于Cookies产生的影响
 

    而对于cookies(可能会用到),由于cookies是保留在Client A上面的,并不会由于服务器的扭转而扭转,所以cookies的利用是不会受到影响的。
综上,对于http/https来说,session不能同步是负载平衡带来的问题,解决方式有如下的一些:
 

    不要向Session中存储用户的登陆信息,权限信息以及一些关键的信息,预防由于session分歧步而导致沉登陆或者信息迷失的问题;
 

    把登陆信息,权限信息及其他一些信息存储到cookies里面或者存储到数据库里面,而后通过数据库同步达到信息同步的主张;
 

3.2.1 认证?
 

    对于认证?,涉及到网络流量有如下一些类型:
 

    Radius认证报文(UDP)
 

    Ipfix的衔接认证报文(TCP)
 

    当泛泛负载平衡正常的情况下,由于数据同步的成分,所以有关设备的信息无论哪个服务器都是一致的,所以不存在什么问题。
 

    由于IPFIX是计费?榈募品巡杉,所以该部门放到计费?槿ソ,这里重要讲Radius认证报文受到的影响。
 

    Radius自身是基于UDP传输的,也就是每次一个报文,你来我往,并不像TCP那样必要成立一个通路,设备认证信息,用户信息等等都通过数据库同步达到数据同步,泛泛正常运行在负载平衡模式下不会出现任何问题,对表就是一台服务器。而当出现单点故障时,会有如下一些影响:
 

    认证起头之前原定进行该认证报文处置的服务器出现故障,则由NLB自动调整到另表一台服务器上进行认证报文的处置。从认证起头到实现用户是不会有什么感触的。
 

    认证交互过程中处置该认证报文的服务器出现故障,则由NLB自动调整到另表一台服务器上进行从新起头的一次认证报文。对于1次交互的PAP,CHAP来说,那阐发就是Radius服务器没响应,而后沉发认证报文或者认证超时(这里必要看NLB什么时辰侦测到单点故障以及调整的速度了)。对于屡次交互的认证方式好比EAP,PEAP等将会给用户予认证失败的提醒,而后必要沉新进行认证,那么这里必要思考若何做?
 

    认证实现之后进行该认证报文处置的服务器出现故障时,对于认证报文来说是没有任何影响的,由于认证已经实现,有关权限已经下发。
 

    综述,在认证过程中必要思考在认证交互过程中出现单点故障时,认证的处置及回馈用户的信息,若是理论上该段功夫能够忽略不计的话,那么该思考也能够只做说明书注明即可。
 

3.2.2 计费?
 

    对于计费?,必须思考如下内容:
 

    Radius记账报文采集器
 

    Ipfix流量报文采集器
 

    对于Radius记账报文采集器来说,它不像认证报文一样能够抛弃,所以必须用一个Radius记账一时表来存储记账起头报文信息或者记账更新报文信息。而后这些信息通过数据库同步方式来达到各NLB服务器数据同步的主张,进而使得在服务器未收到记账实现报文之前,依然可能凭据session id正常的处置记账实现和记账更新。并形成一时计费纪录给计费处置?榻屑品汛χ。
 

    对于出现单点故障时,由NLB切换该源IP(互换机)上的所有IP报文到另表一个服务器上去向理,那么此时已经发送出记账起头/更新报文的信息通过数据库同步在另表那个服务器上也存在,再次收到记账更新/实现报文时也可能正常进行处置。这样的情况下必须满足如下前提:
 

互换机/路由器必须具备Radius记账报文沉发机造
 

    记账一时表的数据库同步必须是实时的,最高优先级的
 

    SAM当收到记账实现报文却找不到对应session id时,必要把报文放入延利益置队列,预防由于数据库同步不实时而把沉要的计费信息给抛弃了。
 

    对于IPFIX流量报文采集器,在负载平衡中出现单点故障时,由于TCP衔接和UDP衔接方式分歧,TCP衔接必须成立TCP通路,而后再在通路中传输数据,若是其成立TCP通路的服务器出现单点故障时,有关和谈处置?楸匦氪锏饺缦乱螅
 

    NTD端必须具备TCP通路沉连职能
 

    NTD方面没有成功发出的流量必要保留并且做延长沉发处置
而由于IPFIX流量是通过报文-内存-数据库一时表-数据库纪录表,这样的档次存储,所以一旦出现单点故障,则在内存中的流量数据将会迷失,单数据库一时表信息由于数据库同步的存在使得数据可能共享并持续实现流量的解析处置;诖,内存中的流量信息保留功夫最大值必须是可控领域的,必要设定一些战术来保险内存中信息实时更新到数据库一时表中。
 

3.3 技术利用
 

3.3.1 认证流量负载平衡

 

    选取NLB技术,能够让多个服务器同时平衡的处置多点并发接见要求,在不增长每台服务器配置的情况下,成倍的提高网络服务的认证治理的机能。
 

    统一高可用群集中的SAM分管处置认证要求,系统机能倍增。
 

RGAS可实现技术参数:
 

    单机40用户/秒
 

    双机80用户/秒
 

    四机120用户/秒
 

3.3.2 业求实时热备份

 

    安全治理认证系统的无故障运行是确保全网用户可能随时使用网络的关键身分,也是网络中心为全校提供高质量网络服务的一个沉要保障。通过高可用群集技术的支持,可达成单台服务不成能实现的整年无故障运行的机能指标。
 

3.3.3 跨校区帐号周游

 

  各大高校的园区规模不休扩大,高校的基础设施建设规模也随之持续美满,由此产生的在高校各园区之间通明的帐号周游需要已经成为越来越多高校亟待解决的问题。RGAC解决规划通过提供在分歧园区之间、分歧接入方式的帐号周游满足帐号周游需要,这种周游对用户是齐全通明的。在所有部署了RGAC系统的地理区域,网络接入用户能够方便使用唯一的帐号接入网络,并且该帐号下的所有效户信息与其它园区维持一致。在后盾,网络中心治理者在进行统一治理,帐号的统一治理极大的提高治理者的工作效能,减轻工作量。
 

3.3.4 数据备份

 

   由于RGAC具罕见据库实时同步技术,可在各数据库服务器同步数据。当某一台数据库服务出现故障,其它同步的数据库服务器可实时的代替,不会影响数据的正常使用,并且在故障排除后,系统必要在可控的功夫领域内自动同步缺失的数据到新的数据库服务器上,从而实现系统容灾的个性,确保数据库单点故障不影响全局系统的正常运行。
 

4 典型组网案例
 

4.1 拓扑规划
 

规划介绍
 

    系统由2台SAM服务器组成一个RG-AC(iSlot官方网站利用群集),它是双机同时处置认证要求的,拥有负载分管,冗余备份的特点。
 

4.2 实现利用
 

4.2.1 数据库自动同步复造
 

    组成NLB系统的二台服务器,当一台服务器数据库有读写操作时,另一台服务器中自动同步操作D芄皇迪至硪惶ǚ务器上开立的用户,数据库自动同步复造正常。
 

4.2.2 NLB双机热备
 

    二台服务器组成NLB双机热备,SAM3.0拥有双机热备职能。关掉一台SAM服务器或者离线,用户可通过认证。
 

4.2.3 规划效益
 

    通过RGAC技术,能够在较少的投资和不扭转原有网络部署规划的情况下解决以下问题。
峰值问题
 

    SAM系统在上线和下线的顶峰期时,这是网络流量的顶峰阶段,其它功夫网络流量相对较少。服务器的处置存在“波峰”和“波谷”的变动,并且“波峰”时,业务量大幼的变动又犯法规,这就使SAM服务器不得不面对“峰值梗塞”问题。原有解决步骤为增长服务器的自身硬件配置或实现单机热备,提高处置能力。但仍存在机能不平衡问题,且这样做,投资成本大并且自身硬件配置提升对于高?突Ю此凳怯衅烤钡。
 

单点故障
 

    单台SAM服务器的设置,不成预防会出现“单点故障”,必要进行SAM服务器“容错”。为实现容错,此刻2.x的做法是主服务器旁安设一台备份服务器做热备。但这样做,平时只有一台服务器工作,另表一台服务器处于空闲状态,无法齐全利用所有服务器的处置资源,投资得不到充分利用,还是相当于一台服务器在工作而已。且当出现“峰值梗塞”时,所得到的很可能是“多米诺”效应,即所有服务器陆续被“堵”至“死”,相互切换直到最后所有服务器都死掉,最终系统齐全瘫痪。并且,当所有服务器都败坏时,无法动态、合理地利用其它资源提供服务或备份。
 

扩大不便
 

    随着SAM利用规模不休的增大,服务器上所要处置的数据量不休增大,同时在线产生的数据和web治理员必要进行治理的数据也会越来越多。若处置资源不够,在未超出系统容量时,往往是客户的要求回应越来越慢,可包容的同时衔接数量逐步减幼,系统机能严沉降落。当超出系统容量后,系统出现故障导致业务中断。为应对日益增多的业务量,系统的扩大性尤为沉要。
 

5 支持AC技术的产品
  

  集群技术

  产品

  支持网卡

  Intel系列网卡

  3Com系列网卡

  不支吃熹他如TP LINK等网卡

  支持系统

  Windows Server 2003

  支持数据库

  MS SQL Server 2000

6 总结和瞻望
 

    RGAC是一种提供高可用性、改善机能和加强利用软件可治理性的有效蹊径。随着基于Intel 平台的服务器业已成为关键性业务和利用的主流服务器,集群技术的利用也日益宽泛。
 

    首先,集群技术是一种较新的技术,通过集群技术,能够在支出较低成本的情况下获得在机能、靠得住性、矫捷性方面的相对较高的收益;
 

    其次,在安全、计费、运营治理系统市场上,可能支持散布式部署,拥有极大可扩大性,为系统部署提供最大的矫捷和方便性;
 

    再次,在提高客户的运营系统的运行机能、不变性,具备容灾能力等方面,RGAC技术是可能可客户带来最大的价值,同时也是有别于竞争敌手的最大的差距化点;
最后,随着IT运营治理的规范,推算机利用职位的逐步提升,系统安全和沉要性的日益增长,集群技术必将会有着极为辽阔的利用远景。
 

iSlot官方网站 - 引领潮水 iSlot官方网站 - 引领潮水

点赞

更多技术博文

任何必要,请联系iSlot官方网站

iSlot官方网站 - 引领潮水

返回顶部

收起
iSlot官方网站 - 引领潮水 文档AI副手
iSlot官方网站 - 引领潮水 文档评价
ev-close ev-close-m
该资料是否解决了您的问题?
ev-close ev-close-m
您对当前页面的中意度若何?
不咋滴
极度好
dark-star dark-star dark-star dark-star dark-star
ev-close ev-close-m
您中意的原因是(多。?
您对文档是否还有其它的问题或建议?
为尽快解决问题,请您留下联系方式以便回复
邮箱
手机号
ev-bg
感激您的反。
iSlot官方网站 - 引领潮水
iSlot官方网站 - 引领潮水
iSlot官方网站 - 引领潮水
请选择服务项目
关关征询页
售前征询 售前征询
售前征询
售后服务 售后服务
售后服务
定见反馈 定见反馈
定见反馈
更多联系方式
【网站地图】