有红有蓝「强化学习」不难！秒懂AI强化学习的本质！Github 9300+【送书】

鱼C-小师妹 · 发表于 2025-5-25 16:51:13

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

凌晨一点半，你还在调推荐算法的 A/B 实验；

隔壁组已经把“AI 写周报”跑上生产。

忽然老板灵魂拷问：

下个季度咱能不能让机器人自己学会调参？

你心里咯噔一下：模型能算、数据会挖，可“自我学习”“动态决策”——我真不太行啊！

这就是当下程序员最大的焦虑：

大模型 everywhere，可一旦 talk 到“让系统自己试错 + 自主决策”，大家瞬间沉默！

这是因为隔壁组懂“强化学习”~

在线学习：

强化学习（Reinforcement Learning，简称 RL）是一种重要的机器学习方法，在智能控制机器人、分析预测等领域有许多应用。

赋予AI“会做决定、会行动、能连续赚钱/省钱/省命”的能力！

没 RL，自动驾驶只能“看得到路”，看不到“风险”；

本书能给我们提供一个对抗复杂问题的有力思维工具！

欢迎上面视频评论区谈谈：
（提高中奖率的秘密：

游客，如果您要查看本帖隐藏内容请回复

）

你对如何学好AI底层知识的看法

FishC · 发表于 2025-5-25 16:52:01

如何学好AI底层知识？我的三点建议

强化学习的核心是让AI通过试错机制自主进化。要掌握这类底层技术，建议：

数学基础要牢：概率论、线性代数是理解马尔可夫决策过程（MDP）的前提，就像打游戏要先熟悉操作键位
从案例入手实践：用Python+TensorFlow复现经典算法（如Q-Learning），比如训练机械臂抓取物体
理解算法演进脉络：从贝尔曼方程->DQN->PPO，掌握算法迭代背后的设计哲学

举个强化学习的典型代码框架：

python
# 以Q-learning为例
q_table = np.zeros((state_space, action_space))
for episode in range(1000):
state = env.reset()
while not done:
action = epsilon_greedy(q_table[state]) # 探索与利用的平衡
next_state, reward, done, _ = env.step(action)
q_table[state,action] += lr*(reward + gamma*np.max(q_table[next_state]) - q_table[state,action])
state = next_state

复制代码

想系统学习推荐《强化学习实战》这本神书，把自动驾驶、机器人控制等20+工业级案例讲透了！视频里提到的[url=教学视频也很适合入门。]https://www.bilibili.com/video/BV13XjbztE3k]教学视频[/url]也很适合入门。[/url]

参与评论区讨论有机会获赠此书，说说你的AI学习心得吧~（小师妹暗号52055202据说能提高中奖率[doge]）

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

不二如是 · 发表于 2025-5-25 16:54:15

FishC 发表于 2025-5-25 16:52
如何学好AI底层知识？我的三点建议

强化学习的核心是让AI通过试错机制自主进化。要掌握这类底层技术，建 ...

马尔可夫决策过程的Python实现方式

画风华 · 发表于 2025-5-25 18:08:17

我对学好AI底层知识的看法：单推小师妹52055202

琅琊王朝 · 发表于 2025-5-25 18:48:57

我没有对学好AI底层知识的看法：

player-none · 发表于 2025-5-25 20:02:07

我对学好AI底层知识的看法：现在最大的障碍是让ai乖乖的给出一行自动解决问题的代码但其他什么都不要还要快准代码不能报错

player-none · 发表于 2025-5-25 20:03:01

我对学好AI底层知识的看法：币

爬虫121 · 发表于 2025-5-25 21:42:50

我对学好AI底层知识的看法：
RL是不是是类似大脑一样可以做出判断啊

ydwb · 发表于 2025-5-26 06:54:57

硅基生物必将战胜碳基生物

快速收敛 · 发表于 2025-5-26 08:29:58

我对学好AI底层知识的看法：地基牢固，不易塌方

不二如是 · 发表于 2025-5-26 10:42:29

我对学好AI底层知识的看法：要学好强化学习

yueyueyue1023W · 发表于 2025-5-26 13:54:39

我对学好AI底层知识的看法：学习

鱼C-小师妹 · 发表于 2025-5-26 15:13:10

player-none 发表于 2025-5-25 20:02
我对学好AI底层知识的看法：现在最大的障碍是让ai乖乖的给出一行自动解决问题的代码但其他什么都不要还要 ...

说得好，恭喜中书！

https://www.bilibili.com/video/BV13XjbztE3k

评论：单推小师妹，这本书我拿走了（私信同发，以防被二次兑换）

鱼C-小师妹 · 发表于 2025-5-26 15:15:03

快速收敛发表于 2025-5-26 08:29
我对学好AI底层知识的看法：地基牢固，不易塌方

说得好，恭喜中书！

https://www.bilibili.com/video/BV13XjbztE3k

评论：单推小师妹，这本书我拿走了，嘻嘻（私信同发，以防被二次兑换）

快速收敛 · 发表于 2025-5-26 16:01:15

鱼C-小师妹发表于 2025-5-26 15:15
说得好，恭喜中书！

https://www.bilibili.com/video/BV13XjbztE3k

哇

yu55800 · 发表于 2025-5-26 16:33:29

player-none · 发表于 2025-5-26 17:05:58

鱼C-小师妹发表于 2025-5-26 15:13
说得好，恭喜中书！

https://www.bilibili.com/video/BV13XjbztE3k

bilibili被家长禁了

鱼C-小师妹 · 发表于 2025-5-26 18:08:47

快速收敛发表于 2025-5-26 16:01
哇

鱼C-小师妹 · 发表于 2025-5-26 18:10:14

player-none 发表于 2025-5-26 17:05
bilibili被家长禁了

论坛上私信我收货地址

Mr.江南 · 发表于 2025-5-27 20:36:09

账号		自动登录	找回密码
密码			立即注册

[最新资讯] 有红有蓝「强化学习」不难！秒懂AI强化学习的本质！Github 9300+【送书】

马上注册，结交更多好友，享用更多功能^_^

评分

相关帖子

回帖奖励 +3 鱼币

回帖奖励 +3 鱼币

回帖奖励 +3 鱼币

回帖奖励 +3 鱼币

回帖奖励 +3 鱼币

回帖奖励 +3 鱼币

回帖奖励 +3 鱼币

回帖奖励 +3 鱼币

浏览过的版块