一种基于深度强化学习结合的宿舍建筑室内环境优化方法及系统
建筑美学强调结构与环境的和谐统一 #生活知识# #生活美学# #美学理论#
本发明涉及室内环境优化领域,尤其是涉及一种基于深度强化学习结合的宿舍建筑室内环境优化方法及系统。
背景技术:
1、现有的建筑性能优化研究主要采用经典的优化算法来进行建筑环境优化,如贝叶斯优化、遗传算法和退火算法等,遗传算法等进化算法基于种群更新或迭代搜索,通常用于寻找多目标优化问题的帕累托前沿解集,但是这类算法仍然表现出两个显着的局限性包括:首先,寻找一组帕累托前沿解必然涉及到与种群更新或迭代搜索相关的耗时过程,但对于控制参数较多的任务来说,会导致运行效率相当低;其次,当优化问题需要对建筑设计进行一些细微的调整,甚至增加一些新的优化目标时,现有算法无法灵活地适应变化的条件,表现出较差的泛化性能。或利用机器学习,如中国申请专利《cn109740243a》,提供了一种基于分件强化学习技术的家具布局方法以实现室内环境优化,分别对每类家具构建环境评分神经网络模型,再结合强化学习对室内家具摆放进行优化,虽然实现了家具布局优化,但在优化过程中其只关注了家具布局的静态合理性,如摆放逻辑或功能性,忽视了其摆放对物理环境造成的影响,无法确保优化方案的舒适性。
2、因此,提供一种能够最大程度保障室内环境舒适度的方法是需要解决的技术问题。
技术实现思路
1、本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种利用深度强化学习进行宿舍室内环境优化的方法,利用深度强化学习方法进行平衡探索和高效搜索最优解获取舒适度最高的室内环境优化方案。
2、本发明的目的可以通过以下技术方案来实现:
3、根据本发明的第一方面,提供了一种基于深度强化学习结合的宿舍建筑室内环境优化方法,所述的方法利用经预训练后的深度强化学习模型进行宿舍建筑室内环境优化;设定宿舍建筑室内环境的建筑设计参数和布局矩阵为深度强化学习模型的状态,设定所述的建筑设计参数的调整为深度强化学习模型的动作,且所述深度强化学习模型的奖励包括室内平均风速奖励和平均有效日光照度奖励。
4、作为优选的技术方案,所述的建筑设计参数包括房间宽度、房间深度、遮阳深度、窗户宽度、卫生间深度、卫生间宽度、入户门位置、卫生间窗户宽度以及卫生间窗户高度。
5、作为优选的技术方案,所述的布局矩阵为n×n的整数矩阵,且矩阵中每一元素代表一类建筑构件类型,所述的建筑构件类型包括房间内外部空间、阳台栏板、窗、门和墙体。
6、作为优选的技术方案,获取所述的布局矩阵的方法包括:将建筑构件类型进行编码,其中,房间内外部空间编码为0,阳台栏板编码为1,窗编码为2,门编码为3,墙体编码为4。
7、作为优选的技术方案,计算所述奖励的表达式为:
8、r=αra-βrastd+γ(r1rd-r2rdstd),
9、其中,ra表示自然通风环境的平均风速奖励;rd表示日照环境的平均有效日光照度奖励;rastd表示风速标准差;rdstd表示有效日光照度标准差;α和β分别表示平均风速权重和平均有效日光照度权重;γ表示有效日光照度奖励系数。
10、作为优选的技术方案,所述的自然通风环境的平均风速奖励的计算方法为:
11、ra=ra1v1+ra2v2+ra3v3,
12、其中,v1表示居住区域的平均风速;v2表示阳台区域的平均风速;v3表示卫生间区域的平均风速;ra1、ra2和ra3分别表示居住区域、阳台区域和生间区域的权重值,且ra1>ra2>ra3。
13、作为优选的技术方案,所述的日照环境的平均有效日光照度奖励的计算方法为:
14、rd=rd1d1+rd2d2,
15、其中,d1为居住区域的平均有效日光照度;d2表示阳台区域的有效日光照度;ra1和ra2分别表示居住区域和阳台区域的权重值,且rd1>rd2。
16、作为优选的技术方案,所述的预训练包括:
17、依据宿舍平面进行参数化,将宿舍中的建筑设计参数作为形态控制指标,基于所述的形态控制指标构建三维模型,基于所述的三维模型获取初始状态,重复执行以下步骤至迭代次数达到最大迭代次数:
18、基于状态生成深度强化学习模型中智能体的动作,并获取执行该动作后的新状态;其中,首次迭代时的状态为初始状态,第n次迭代的状态为前一次迭代后的新状态;
19、计算所述新状态下,对应的奖励;
20、基于所述的新状态和奖励,利用深度确定性梯度算法更新深度强化学习模型参数。
21、根据本发明的第二方面,提供了一种基于深度强化学习结合的宿舍建筑室内环境优化系统,所述系统用于实现上述的方法,包括:可视化平台,用于基于宿舍平面进行参数化宿舍建模,以及基于深度强化学习模型生成的动作更新宿舍建模;深度强化学习算法端,用于依据可视化平台反馈的状态生成当前状态下奖励值最大的动作。
22、作为优选的技术方案,所述的可视化平台与深度强化学习算法端利用套接字方法进行数据传输。
23、与现有技术相比,本发明具有以下优点:
24、1)、本发明依据室内风速和有效日光照度等环境参数进行奖励计算,并设定宿舍的建筑设计参数为状态,建筑设计参数的调整作为动作,利用深度强化学习模型探索包括风速和有效日光照度的动态环境因素与建筑设计参数之间的耦合关系,剔除仅依据建筑空间合理性(如室内空间利用率最大)而生成的不合理方案,以生成舒适度更高且更适合人类居住的室内环境优化方案,如在进行优化方案时考虑主要生活区域的有效日光照度等。
25、2)、本发明采用预训练后的深度强化学习模型进行室内环境优化设计,相较于传统优化算法,本发明所提供的方法生成优化方案的效率更高,且本发明所提供的方法具备良好的泛化性,在非训练场景下的优化效果仍旧较好。
技术特征:
1.一种基于深度强化学习结合的宿舍建筑室内环境优化方法,其特征在于,所述的方法利用经预训练后的深度强化学习模型进行宿舍建筑室内环境优化;设定宿舍建筑室内环境的建筑设计参数和布局矩阵为深度强化学习模型的状态,设定所述的建筑设计参数的调整为深度强化学习模型的动作,且所述深度强化学习模型的奖励包括室内平均风速奖励和平均有效日光照度奖励。
2.根据权利要求1所述的一种基于深度强化学习结合的宿舍建筑室内环境优化方法,其特征在于,所述的建筑设计参数包括房间宽度、房间深度、遮阳深度、窗户宽度、卫生间深度、卫生间宽度、入户门位置、卫生间窗户宽度以及卫生间窗户高度。
3.根据权利要求1所述的一种基于深度强化学习结合的宿舍建筑室内环境优化方法,其特征在于,所述的布局矩阵为n×n的整数矩阵,且矩阵中每一元素代表一类建筑构件类型,所述的建筑构件类型包括房间内外部空间、阳台栏板、窗、门和墙体。
4.根据权利要求3所述的一种基于深度强化学习结合的宿舍建筑室内环境优化方法,其特征在于,获取所述的布局矩阵的方法包括:将建筑构件类型进行编码,其中,房间内外部空间编码为0,阳台栏板编码为1,窗编码为2,门编码为3,墙体编码为4。
5.根据权利要求1所述的一种基于深度强化学习结合的宿舍建筑室内环境优化方法,其特征在于,计算所述奖励的表达式为:
6.根据权利要求5所述的一种基于深度强化学习结合的宿舍建筑室内环境优化方法,其特征在于,所述的自然通风环境的平均风速奖励的计算方法为:
7.根据权利要求5所述的一种基于深度强化学习结合的宿舍建筑室内环境优化方法,其特征在于,所述的日照环境的平均有效日光照度奖励的计算方法为:
8.根据权利要求1所述的一种基于深度强化学习结合的宿舍建筑室内环境优化方法,其特征在于,所述的预训练包括:
9.一种基于深度强化学习结合的宿舍建筑室内环境优化系统,其特征在于,所述系统用于实现如权利要求1~8中任一项所述的方法,包括:
10.根据权利要求9所述的一种基于深度强化学习结合的宿舍建筑室内环境优化系统,其特征在于,所述的可视化平台与深度强化学习算法端利用套接字方法进行数据传输。
技术总结
本发明涉及一种基于深度强化学习结合的宿舍建筑室内环境优化方法及系统,其中,方法利用经预训练后的深度强化学习模型进行宿舍建筑室内环境优化;设定宿舍建筑室内环境的建筑设计参数和布局矩阵为深度强化学习模型的状态,设定建筑设计参数的调整为深度强化学习模型的动作,且深度强化学习模型的奖励包括室内平均风速奖励和平均有效日光照度奖励;系统用于实现上述方法。与现有技术相比,本发明具有优化效果好以及优化效率高等优点。
技术研发人员:姚佳伟,袁烽,石泽葳,黄辰宇,王锦煜
受保护的技术使用者:同济大学
技术研发日:
技术公布日:2025/6/23
网址:一种基于深度强化学习结合的宿舍建筑室内环境优化方法及系统 https://www.yuejiaxmz.com/news/view/1323410
相关内容
AI驱动宿舍环境优化一种基于深度学习的无线网络资源优化系统及方法
多层医院砖混结构宿舍电气系统设计与优化
西安市采暖季宿舍室内空气环境调研与优化分析
学生宿舍环境舒适度提升方案.docx
建筑四公司宿舍管理制度优化方案
项目部宿舍环境管理制度的优化与实施策略
基于深度强化学习的新型电力系统调度优化方法综述
建筑室内环境建模、控制与优化及能耗预测.docx
绿色建筑室内环境监测系统