鱼C论坛

 找回密码
 立即注册
查看: 802|回复: 2

[已解决]python机器学习memoryerror

[复制链接]
发表于 2023-6-3 19:14:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
这个代码造成的MemoryError怎么修改呀 ai调不出来
import numpy as np
import random
import matplotlib.pyplot as plt

# 定义参数和常量
M = 1  # 市场需求函数的截距
m = 0.5  # 次级市场的价格
alpha = 1.2  # 高质量产品的价格溢价
theta = 0.5  # 厂商2的产品为高质量的概率
cA = 0.2  # 厂商1的边际成本
cB = 0.4  # 厂商2的边际成本
gamma = 0.9  # 未来奖励的折扣因子
epsilon = 0.1  # 探索率,用于epsilon-贪心策略
num_episodes = 100  # 训练的轮数
num_steps = 10  # 每轮的步数

# 定义奖励函数
def reward(state, action):
    P, cA, cB = state
    qA, qB = action
    profitA = qA * (P - cA)
    profitB = qB * (P - cB)
    return profitA, profitB

# 定义转移函数
def transition(state, action):
    P, cA, cB = state
    qA, qB = action
    quality = random.choices(["L", "H"], weights=[1 - theta, theta])[0]
    if quality == "L":
        next_P = M - qA - qB
    else:
        next_P = alpha * M - qA - qB
    next_cA = cA
    next_cB = random.uniform(0, M)
    next_state = (next_P, next_cA, next_cB)
    return next_state

# 定义状态空间和动作空间
state_space = []
for P in np.arange(0, M + 0.01, 0.1):
    for cA in np.arange(0, M + 0.01, 0.1):
        for cB in np.arange(0, M + 0.01, 0.1):
            state_space.append((P, cA, cB))
action_space = np.arange(0, M + 0.01, 0.1)

# 初始化两个厂商的Q表
Q1 = {}  # 厂商1的Q表
Q2 = {}  # 厂商2的Q表
for state in state_space:
    for action in action_space:
        Q1[(str(state), str(action))] = 0
        Q2[(str(state), str(action))] = 0

# 训练Q-learning算法
state_Ps = []
state_As = []
state_Bs = []
profits_A = []
profits_B = []

for episode in range(num_episodes):
    # 随机初始化初始状态和动作(假设初始市场价格为M)
    state_Ps.append(M)
    state_cA = cA
    state_cB = cB
    state = (M, state_cA, state_cB)
    action_A = random.choice(action_space)
    action_B = random.choice(action_space)
    action = (action_A, action_B)

    total_rewardA = 0
    total_rewardB = 0

    for step in range(num_steps):
        # epsilon-贪心策略选择动作
        if random.random() < epsilon:
            next_action_A = random.choice(action_space)
            next_action_B = random.choice(action_space)
        else:
            if (str(state), str(action)) not in Q1:
                Q1[(str(state), str(action))] = 0
            if (str(state), str(action)) not in Q2:
                Q2[(str(state), str(action))] = 0
            max_qA = max(Q1.get((str(state), str(a)), 0) for a in action_space)
            max_qB = max(Q2.get((str(state), str(a)), 0) for a in action_space)
            next_action_A = max(Q1, key=lambda x: Q1[x])[1]
            next_action_B = max(Q2, key=lambda x: Q2[x])[1]

        next_state = transition(state, action)
        next_P, next_cA, next_cB = next_state

        # 执行动作,得到下一个状态和奖励
        rewardA, rewardB = reward(state, action)

        # 更新Q值
        if (str(state), str(action)) not in Q1:
            Q1[(str(state), str(action))] = 0
        if (str(state), str(action)) not in Q2:
            Q2[(str(state), str(action))] = 0
        Q1[(str(state), str(action))] += alpha * (rewardA + gamma * max_qA - Q1[(str(state), str(action))])
        Q2[(str(state), str(action))] += alpha * (rewardB + gamma * max_qB - Q2[(str(state), str(action))])

        next_action = (next_action_A, next_action_B)

        # 更新状态和动作
        state = next_state
        action = next_action
        state_Ps.append(next_P)
        state_As.append(next_cA)
        state_Bs.append(next_cB)
        total_rewardA += rewardA
        total_rewardB += rewardB

    # 保存每轮的利润
    profits_A.append(total_rewardA)
    profits_B.append(total_rewardB)

# 绘制市场价格、边际成本和利润的变化曲线
plt.subplot(3, 1, 1)
plt.plot(state_Ps)
plt.xlabel("Step")
plt.ylabel("Market Price")

plt.subplot(3, 1, 2)
plt.plot(state_As, label="Manufacturer A")
plt.plot(state_Bs, label="Manufacturer B")
plt.xlabel("Step")
plt.ylabel("Marginal Cost")
plt.legend()

plt.subplot(3, 1, 3)
plt.plot(profits_A, label="Manufacturer A")
plt.plot(profits_B, label="Manufacturer B")
plt.xlabel("Episode")
plt.ylabel("Profit")
plt.legend()

plt.tight_layout()
plt.show()

最佳答案
2023-6-3 19:15:54
MemoryError通常是因为程序使用的内存超出了可用内存限制导致的。可以尝试以下几种方法来解决:

1. 适当减小数组的尺寸或分段处理数组,尽量将内存占用量降到可接受范围内。
2. 使用一些库函数来代替手动写循环和计算,比如使用numpy库的矩阵计算可以显著降低内存开销。
3. 增加物理内存或虚拟内存的限制,但这种方法可能会导致系统变慢或变得不稳定。

在这个代码中,使用了三个嵌套的for循环来生成状态空间,可能会导致内存消耗巨大。可以考虑使用其他方式生成状态空间,比如使用numpy.linspace()函数来代替for循环。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-6-3 19:15:11 | 显示全部楼层
这个代码造成MemoryError的原因是状态空间和动作空间太大,导致Q表无法存储在内存中。可以通过减小状态空间和动作空间的大小或者使用其他方法来解决这个问题。

其中可以考虑使用稀疏矩阵来存储Q表,或者使用函数逼近方法,如神经网络等来代替Q表。此外,还可以考虑使用分布式计算来加速训练过程,如使用多台计算机或者GPU。

如果希望减小状态空间和动作空间的大小,可以考虑调整参数的范围或者采样间隔。例如,可以将参数的范围从0到1改为0到0.1,采样间隔从0.01改为0.001。这样可以减小状态空间和动作空间的大小,从而避免MemoryError的问题。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-6-3 19:15:54 | 显示全部楼层    本楼为最佳答案   
MemoryError通常是因为程序使用的内存超出了可用内存限制导致的。可以尝试以下几种方法来解决:

1. 适当减小数组的尺寸或分段处理数组,尽量将内存占用量降到可接受范围内。
2. 使用一些库函数来代替手动写循环和计算,比如使用numpy库的矩阵计算可以显著降低内存开销。
3. 增加物理内存或虚拟内存的限制,但这种方法可能会导致系统变慢或变得不稳定。

在这个代码中,使用了三个嵌套的for循环来生成状态空间,可能会导致内存消耗巨大。可以考虑使用其他方式生成状态空间,比如使用numpy.linspace()函数来代替for循环。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-22 23:20

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表