无需公式或代码,用生活实例谈谈 AI 自动控制技术“强化学习”算法框架

发布时间:2025-03-04 23:33

《谈判的逻辑:科学与艺术》:用逻辑框架指导谈判决策。 #生活技巧# #谈判技巧# #谈判策略书#

最新推荐文章于 2024-12-12 16:57:13 发布

枇杷鹭 于 2020-05-07 16:13:53 发布

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

不用公式、不用代码,白话讲讲强化学习原理

The best way to learn is to teach others.

战胜围棋高手李世石的 AlphaGo ,称霸星际争霸2的 AIphaStar…这些先进的自动控制技术都离不开“强化学习”这个算法框架。有人说,强化学习是一种“试错”技术,是在状态与动作间建立了一种高级的“哈希映射”​。学习强化学习半载,我个人​的心得是:强化学习让实时决策不再“鼠目寸光”​,本文我们就通过​“小赛能否写完假期作业”这个生活实例来谈谈。

在说强化学习之前,我们先来聊聊他的两个兄弟:监督学习和无监督学习。

监督学习

监督学习就是,你喂给机器一堆有标签的数据,比如下表这样。

特征值 标签 小明, 爱穿裙子, 出门前化妆 女孩 小张, 不穿裙子, 出门前不妆 男孩 … … 小何, 爱穿裙子, 出门前不妆 男孩

经过对有标签数据的训练/学习后,我们就得到了一个分类器/回归器,可以根据无标签的数据推测出其标签。

特征值 AI所推测出的标签 小钗, 爱穿裙子, 出门前化妆 女孩 小黛, 爱穿裙子, 出门前化妆 女孩 小盘, 不穿裙子, 出门前不妆 男孩 无监督学习

无监督学习就是,你喂给机器一堆无标签的数据,比如下表这样。

<

特征值 标签 (1,1,1,1) None (1,4,-2,3) None (-1,2,0,0) None (1000,-2,4,1) None … … (0,1,-2,0) None

网址:无需公式或代码,用生活实例谈谈 AI 自动控制技术“强化学习”算法框架 https://www.yuejiaxmz.com/news/view/807311

相关内容

生活中的控制用计算机,浅谈计算机在自动控制中的应用
AI智能家居系统如何实现自动化控制?
计算机应用浅谈家庭自动化系统
AI Agent:7个国内框架 & Agent应用
PHP框架性能优化:代码优化技巧
大模型推理框架:赋能AI新时代的强大引擎 大模型推理框架:赋能AI新时代的强大引擎在当今这个数据驱动的时代,人工智能技术正以惊人的速度改变着我们的生活和工作方式。...
AI助力自动化:利用AI生成BAT脚本与Python代码,简化日常生活任务
结合生活实际,谈谈物联网技术在某一生活领域中的应用设想
AI技术在实际应用中的前景
家庭自动化框架及应用实践指南

随便看看