当前位置:首页 > 科技文档 > 数学 > 正文

预测资源分配:马尔可夫决策过程的无监督学习

中国科学:信息科学 页数: 18 2024-08-02
摘要: 当已知未来的移动轨迹等信息时,面向视频点播业务的预测资源分配可以在满足用户体验的前提下降低基站能耗或提高网络吞吐量.传统的预测资源分配方法采用先预测用户轨迹等信息再优化功率等资源分配的方法,在预测窗较长时预测误差大,导致预测所带来的增益降低.为了解决这个问题,近期已有文献把预测资源分配建模为马尔可夫决策过程,采用深度强化学习进行在线决策.然而,对于这类适于采用强化学习的马尔可夫...

开通会员,享受整站包年服务立即开通 >