
学习不用那么功利,二师兄带你从更高维度轻松阅读源码~
上篇文章,我们分析了Nacos客户端订阅的核心流程:Nacos客户端通过一个定时任务,每6秒从注册中心获取实例列表,当发现实例发生变化时,发布变更事件,订阅者进行业务处理,然后更新内存中和本地的缓存中的实例。
这篇文章为服务订阅的第二篇,我们重点来分析,定时任务获取到最新实例列表之后,整个事件机制是如何处理的。
回顾整个流程
先回顾一下客户端服务订阅的基本流程:

在第一步调用subscribe方法时,会订阅一个EventListener事件。而在定时任务UpdateTask定时获取实例列表之后,会调用ServiceInfoHolder#processServiceInfo方法对ServiceInfo进行本地处理,这其中就包括和事件处理。
监听事件的注册
在subscribe方法中,通过如下方式进行了监听事件的注册:
- @Override
- publicvoidsubscribe(StringserviceName,StringgroupName,List<String>clusters,EventListenerlistener)
- throwsNacosException{
- if(null==listener){
- return;
- }
- StringclusterString=StringUtils.join(clusters,",");
- changeNotifier.registerListener(groupName,serviceName,clusterString,listener);
- clientProxy.subscribe(serviceName,groupName,clusterString);
- }
这里的changeNotifier.registerListener便是进行具体的事件注册逻辑。追进去看一下实现源码:
- //InstancesChangeNotifier
- publicvoidregisterListener(StringgroupName,StringserviceName,Stringclusters,EventListenerlistener){
- Stringkey=ServiceInfo.getKey(NamingUtils.getGroupedName(serviceName,groupName),clusters);
- ConcurrentHashSet<EventListener>eventListeners=listenerMap.get(key);
- if(eventListeners==null){
- synchronized(lock){
- eventListeners=listenerMap.get(key);
- if(eventListeners==null){
- eventListeners=newConcurrentHashSet<EventListener>();
- //将EventListener缓存到listenerMap
- listenerMap.put(key,eventListeners);
- }
- }
- }
- eventListeners.add(listener);
- }
可以看出,事件的注册便是将EventListener存储在InstancesChangeNotifier的listenerMap属性当中了。
这里的数据结构为Map,key为服务实例信息的拼接,value为监听事件的集合。
事件注册流程就这么简单。这里有一个双重检查锁的实践案例,不知道你留意到没?可以学习一下。
ServiceInfo的处理
上面完成了事件的注册,现在就追溯一下触发事件的来源。UpdateTask中获取到最新实例会进行本地化处理,部分代码如下:
- //获取缓存的service信息
- ServiceInfoserviceObj=serviceInfoHolder.getServiceInfoMap().get(serviceKey);
- if(serviceObj==null){
- //根据serviceName从注册中心服务端获取Service信息
- serviceObj=namingClientProxy.queryInstancesOfService(serviceName,groupName,clusters,0,false);
- serviceInfoHolder.processServiceInfo(serviceObj);
- lastRefTime=serviceObj.getLastRefTime();
- return;
- }
这部分逻辑在上篇文章中已经分析过了,这里重点看serviceInfoHolder#processServiceInfo中的业务逻辑处理。先看流程图,然后看代码。

上述逻辑简单说就是:判断一下新的ServiceInfo数据是否正确,是否发生了变化。如果数据格式正确,且发生的变化,那就发布一个InstancesChangeEvent事件,同时将ServiceInfo写入本地缓存。
下面看一下代码实现:
- publicServiceInfoprocessServiceInfo(ServiceInfoserviceInfo){
- StringserviceKey=serviceInfo.getKey();
- if(serviceKey==null){
- returnnull;
- }
- ServiceInfooldService=serviceInfoMap.get(serviceInfo.getKey());
- if(isEmptyOrErrorPush(serviceInfo)){
- //emptyorerrorpush,justignore
- returnoldService;
- }
- //缓存服务信息
- serviceInfoMap.put(serviceInfo.getKey(),serviceInfo);
- //判断注册的实例信息是否已变更
- booleanchanged=isChangedServiceInfo(oldService,serviceInfo);
- if(StringUtils.isBlank(serviceInfo.getJsonFromServer())){
- serviceInfo.setJsonFromServer(JacksonUtils.toJson(serviceInfo));
- }
- //通过prometheus-simpleclient监控服务缓存Map的大小
- MetricsMonitor.getServiceInfoMapSizeMonitor().set(serviceInfoMap.size());
- //服务实例已变更
- if(changed){
- NAMING_LOGGER.info("currentips:("+serviceInfo.ipCount()+")service:"+serviceInfo.getKey()+"->"
- +JacksonUtils.toJson(serviceInfo.getHosts()));
- //添加实例变更事件,会被推动到订阅者执行
- NotifyCenter.publishEvent(newInstancesChangeEvent(serviceInfo.getName(),serviceInfo.getGroupName(),
- serviceInfo.getClusters(),serviceInfo.getHosts()));
- //记录Service本地文件
- DiskCache.write(serviceInfo,cacheDir);
- }
- returnserviceInfo;
- }
可以对照流程图和代码中的注释部分进行理解这个过程。
我们要讲的重点是服务信息变更之后,发布的InstancesChangeEvent,也就是流程图中标红的部分。
事件追踪
上面的事件是通过NotifyCenter进行发布的,NotifyCenter中的核心流程如下:

NotifyCenter中进行事件发布,发布的核心逻辑是:
- 根据InstancesChangeEvent事件类型,获得对应的CanonicalName;
- 将CanonicalName作为Key,从NotifyCenter#publisherMap中获取对应的事件发布者(EventPublisher);
- EventPublisher将InstancesChangeEvent事件进行发布。
NotifyCenter中的核心代码实现如下:
- privatestaticbooleanpublishEvent(finalClass<?extendsEvent>eventType,finalEventevent){
- if(ClassUtils.isAssignableFrom(SlowEvent.class,eventType)){
- returnINSTANCE.sharePublisher.publish(event);
- }
- //根据InstancesChangeEvent事件类型,获得对应的CanonicalName;
- finalStringtopic=ClassUtils.getCanonicalName(eventType);
- //将CanonicalName作为Key,从NotifyCenter#publisherMap中获取对应的事件发布者(EventPublisher);
- EventPublisherpublisher=INSTANCE.publisherMap.get(topic);
- if(publisher!=null){
- //EventPublisher将InstancesChangeEvent事件进行发布。
- returnpublisher.publish(event);
- }
- LOGGER.warn("Thereareno[{}]publishersforthisevent,pleaseregister",topic);
- returnfalse;
- }
上述代码中的INSTANCE为NotifyCenter的单例模式实现。那么,这里的publisherMap中key(CanonicalName)和value(EventPublisher)之间的关系是什么时候建立的呢?
这个是在NacosNamingService实例化时调用init方法中进行绑定的:
- //Publisher的注册过程在于建立InstancesChangeEvent.class与EventPublisher的关系。
- NotifyCenter.registerToPublisher(InstancesChangeEvent.class,16384);
registerToPublisher方法默认采用了DEFAULT_PUBLISHER_FACTORY来进行构建。
- publicstaticEventPublisherregisterToPublisher(finalClass<?extendsEvent>eventType,finalintqueueMaxSize){
- returnregisterToPublisher(eventType,DEFAULT_PUBLISHER_FACTORY,queueMaxSize);
- }
如果查看NotifyCenter中静态代码块,会发现DEFAULT_PUBLISHER_FACTORY默认构建的EventPublisher为DefaultPublisher。
至此,我们得知,在NotifyCenter中它维护了事件名称和事件发布者的关系,而默认的事件发布者为DefaultPublisher。
DefaultPublisher的事件发布
查看DefaultPublisher的源码,会发现它继承自Thread,也就是说它是一个线程类。同时,它又实现了EventPublisher,也就是我们前面提到的发布者。
- publicclassDefaultPublisherextendsThreadimplementsEventPublisher{}
在DefaultPublisher的init方法实现如下:
- @Override
- publicvoidinit(Class<?extendsEvent>type,intbufferSize){
- //守护线程
- setDaemon(true);
- //设置线程名字
- setName("nacos.publisher-"+type.getName());
- this.eventType=type;
- this.queueMaxSize=bufferSize;
- //阻塞队列初始化
- this.queue=newArrayBlockingQueue<>(bufferSize);
- start();
- }
也就是说,当DefaultPublisher被初始化时,是以守护线程的方式运作的,其中还初始化了一个阻塞队列,队列的默认大小为16384。
最后调用了start方法:
- @Override
- publicsynchronizedvoidstart(){
- if(!initialized){
- //startjustcalledonce
- super.start();
- if(queueMaxSize==-1){
- queueMaxSize=ringBufferSize;
- }
- initialized=true;
- }
- }
start方法中调用了super.start,此时等于启动了线程,会执行对应的run方法。
run方法中只调用了如下方法:
- voidopenEventHandler(){
- try{
- //Thisvariableisdefinedtoresolvetheproblemwhichmessageoverstockinthequeue.
- intwaitTimes=60;
- //for死循环不断的从队列中取出Event,并通知订阅者Subscriber执行Event
- //Toensurethatmessagesarenotlost,enableEventHandlerwhen
- //waitingforthefirstSubscribertoregister
- for(;;){
- if(shutdown||hasSubscriber()||waitTimes<=0){
- break;
- }
- ThreadUtils.sleep(1000L);
- waitTimes--;
- }
- for(;;){
- if(shutdown){
- break;
- }
- ////从队列取出Event
- finalEventevent=queue.take();
- receiveEvent(event);
- UPDATER.compareAndSet(this,lastEventSequence,Math.max(lastEventSequence,event.sequence()));
- }
- }catch(Throwableex){
- LOGGER.error("Eventlistenerexception:",ex);
- }
- }
这里写了两个死循环,第一个死循环可以理解为延时效果,也就是说线程启动时最大延时60秒,在这60秒中每隔1秒判断一下当前线程是否关闭,是否有订阅者,是否超过60秒。如果满足一个条件,就可以提前跳出死循环。
而第二个死循环才是真正的业务逻辑处理,会从阻塞队列中取出一个事件,然后通过receiveEvent方法进行执行。
那么,队列中的事件哪儿来的呢?此时,你可能已经想到刚才DefaultPublisher的发布事件方法被调用了。来看看它的publish方法实现:
- @Override
- publicbooleanpublish(Eventevent){
- checkIsStart();
- booleansuccess=this.queue.offer(event);
- if(!success){
- LOGGER.warn("Unabletopluginduetointerruption,synchronizesendingtime,event:{}",event);
- receiveEvent(event);
- returntrue;
- }
- returntrue;
- }
可以看到,DefaultPublisher的publish方法的确就是往阻塞队列中存入事件。这里有个分支逻辑,如果存入失败,会直接调用receiveEvent,和从队列中取出事件执行的方法一样。可以理解为,如果向队列中存入失败,则立即执行,不走队列了。
最后,再来看看receiveEvent方法的实现:
- voidreceiveEvent(Eventevent){
- finallongcurrentEventSequence=event.sequence();
- if(!hasSubscriber()){
- LOGGER.warn("[NotifyCenter]the{}islost,becausethereisnosubscriber.");
- return;
- }
- //通知订阅者执行Event
- //Notificationsingleeventlistener
- for(Subscribersubscriber:subscribers){
- //Whethertoignoreexpirationevents
- if(subscriber.ignoreExpireEvent()&&lastEventSequence>currentEventSequence){
- LOGGER.debug("[NotifyCenter]the{}isunacceptabletothissubscriber,becausehadexpire",
- event.getClass());
- continue;
- }
- //BecauseunifyingsmartSubscriberandsubscriber,sohereneedtothinkofcompatibility.
- //Removeoriginaljudgepartofcodes.
- notifySubscriber(subscriber,event);
- }
- }
这里最主要的逻辑就是遍历DefaultPublisher的subscribers(订阅者集合),然后执行通知订阅者的方法。
那么有朋友要问了这subscribers中的订阅者哪里来的呢?这个还要回到NacosNamingService的init方法中:
- //将Subscribe注册到Publisher
- NotifyCenter.registerSubscriber(changeNotifier);
该方法最终会调用NotifyCenter的addSubscriber方法:
- privatestaticvoidaddSubscriber(finalSubscriberconsumer,Class<?extendsEvent>subscribeType,
- EventPublisherFactoryfactory){
- finalStringtopic=ClassUtils.getCanonicalName(subscribeType);
- synchronized(NotifyCenter.class){
- //MapUtils.computeIfAbsentisaunsafemethod.
- MapUtil.computeIfAbsent(INSTANCE.publisherMap,topic,factory,subscribeType,ringBufferSize);
- }
- //获取时间对应的Publisher
- EventPublisherpublisher=INSTANCE.publisherMap.get(topic);
- if(publisherinstanceofShardedEventPublisher){
- ((ShardedEventPublisher)publisher).addSubscriber(consumer,subscribeType);
- }else{
- //添加到subscribers集合
- publisher.addSubscriber(consumer);
- }
- }
其中核心逻辑就是将订阅事件、发布者、订阅者三者进行绑定。而发布者与事件通过Map进行维护、发布者与订阅者通过关联关系进行维护。
发布者找到了,事件也有了,最后看一下notifySubscriber方法:
- @Override
- publicvoidnotifySubscriber(finalSubscribersubscriber,finalEventevent){
- LOGGER.debug("[NotifyCenter]the{}willreceivedby{}",event,subscriber);
- //执行订阅者Event
- finalRunnablejob=()->subscriber.onEvent(event);
- finalExecutorexecutor=subscriber.executor();
- if(executor!=null){
- executor.execute(job);
- }else{
- try{
- job.run();
- }catch(Throwablee){
- LOGGER.error("Eventcallbackexception:",e);
- }
- }
- }
逻辑比较简单,如果订阅者定义了Executor,那么使用它定义的Executor进行事件的执行,如果没有,那就创建一个线程进行执行。
至此,整个服务订阅的事件机制完成。
小结
整体来看,整个服务订阅的事件机制还是比较复杂的,因为用到了事件的形式,逻辑就比较绕,而且这期间还掺杂了守护线程,死循环,阻塞队列等。需要重点理解NotifyCenter对事件发布者、事件订阅者和事件之间关系的维护,而这一关系的维护的入口就位于NacosNamingService的init方法当中。
下面再梳理一下几个核心流程:
ServiceInfoHolder中通过NotifyCenter发布了InstancesChangeEvent事件;
NotifyCenter中进行事件发布,发布的核心逻辑是:
- 根据InstancesChangeEvent事件类型,获得对应的CanonicalName;
- 将CanonicalName作为Key,从NotifyCenter#publisherMap中获取对应的事件发布者(EventPublisher);
- EventPublisher将InstancesChangeEvent事件进行发布。
- InstancesChangeEvent事件发布:
通过EventPublisher的实现类DefaultPublisher进行InstancesChangeEvent事件发布;
- DefaultPublisher本身以守护线程的方式运作,在执行业务逻辑前,先判断该线程是否启动;
- 如果启动,则将事件添加到BlockingQueue中,队列默认大小为16384;
- 添加到BlockingQueue成功,则整个发布过程完成;
- 如果添加失败,则直接调用DefaultPublisher#receiveEvent方法,接收事件并通知订阅者;
- 通知订阅者时创建一个Runnable对象,执行订阅者的Event。
- Event事件便是执行订阅时传入的事件;
如果添加到BlockingQueue成功,则走另外一个业务逻辑:
- DefaultPublisher初始化时会创建一个阻塞(BlockingQueue)队列,并标记线程启动;
- DefaultPublisher本身是一个Thread,当执行super.start方法时,会调用它的run方法;
- run方法的核心业务逻辑是通过openEventHandler方法处理的;
- openEventHandler方法通过两个for循环,从阻塞队列中获取时间信息;
- 第一个for循环用于让线程启动时在60s内检查执行条件;
- 第二个for循环为死循环,从阻塞队列中获取Event,并调用DefaultPublisher#receiveEvent方法,接收事件并通知订阅者;
- Event事件便是执行订阅时传入的事件;
关于Nacos Client服务定义的事件机制就将这么多,下篇我们来讲讲故障转移和缓存的实现。
原文链接:https://mp.weixin.qq.com/s/RqqCZEBrpeVqMnKxnyiFhw








发表评论
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。