近期,信息工程学院徐超教授团队在信息时效性驱动的物联网数据动态更新研究中取得重要进展,并基于研究成果以第一作者身份在CCF A推荐期刊《IEEE Transactions on Mobile Computing》(移动计算领域TOP期刊)发表了题为“Optimal Status Updates for Minimizing Age of Correlated Information in IoT Networks with Energy Harvesting Sensors”的文章,探寻了数据相关性、能量收集与消耗因果性、环境部分可观测性等实际因素对于数据新鲜度的作用机理,首次联合LSTM和SAC技术,设计了基于深度强化学习的数据动态更新算法,有效提升数据融合中心(Data Fusion Center,DFC)处信息时效性。
对于诸多实时物联网应用而言,来自不同传感器的状态更新数据存在相互关联性,需要在DFC处进行融合后才能被进一步使用。因此,对于能量有限的传感器节点,如果无法对其数据感知与传输过程进行动态有效调度,则无法保障DFC处的数据时效性,并最终影响相关实时决策的准确性和可靠性。
本研究以上述问题为切入点,进一步综合考虑传感器能量收集与消耗因果性、传感器能量信息难以准确获知以及传输信道可靠性时变且未知等实际环境因素,利用相关信息年龄(Age of Correlated Information,AoCI)作为DFC处信息新鲜度的衡量指标,将能量收集物联网中数据动态更新问题建模为部分可观测马尔科夫决策过程(Partially Observable Markov Decision Process,POMDP),并首次设计了基于LSTM和SAC的深度强化学习算法求解该问题。通过在算法中嵌入所设计的动作分解与映射(Action Decomposition and Mapping,AMD)机制,使其可以有效解决大规模动作空间问题。与现有基于DRQN和DRDPG的状态更新算法相比,所提出算法在收敛性、可扩展性和稳定性方面具有更好的性能;此外,通过结合ADM机制,所提出算法即便面对具有超过80万可用动作的大规模场景,仍然可保证收敛并显著提升DFC处信息时效性。
《IEEE Transactions on Mobile Computing》旨在传播移动计算相关领域的最新研究和开发成果,属于计算机网络领域仅有的三本CCF A推荐期刊之一。该研究得到国家自然科学基金面上项目及陕西省青年科技新星等项目的资助。