鱼C论坛

 找回密码
 立即注册
查看: 62544|回复: 1139

[其他工具] 纳尼!「FishC」AI小助手来啦!!学习/娱乐/排忧解难 必备佳品~~

  [复制链接]
发表于 2024-3-10 19:52:34 | 显示全部楼层
如何免费使用ChatGPT4.0
@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-10 19:55:24 | 显示全部楼层
bacth-norm和layer-norm有什么区别详细说明,并举例说明

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-10 20:02:23 | 显示全部楼层
FishC 发表于 2024-3-10 19:56
Batch normalization和Layer normalization是两种常用的神经网络正则化方法。它们的目的都是为了加快神 ...

我还是不太明白,可不可以在详细的解释一下内部原理。标准化具体是在哪个维度实现的。

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-10 20:08:54 | 显示全部楼层
FishC 发表于 2024-3-10 19:56
Batch normalization和Layer normalization是两种常用的神经网络正则化方法。它们的目的都是为了加快神 ...

比如拿一个batch的数据,x是一个时间序列模型的输入数据,其中x的大小为(8,96,12),96代表96个token,12代表每个token有12个特征。层归一化是不是对每个特征的96个时间进行归一化,批归一化又是什么样的呢。

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-10 20:15:58 | 显示全部楼层
可不可以详细的描述一下时空序列预测是什么,它跟时间序列预测有什么区别和联系

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-11 18:12:15 | 显示全部楼层
时间序列预测模型经常遭受时间序列数据的独特特征:它们的统计特性,如均值和方差,可能会随着时间而变化。是什么意思,举例说明一下

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-11 21:25:51 | 显示全部楼层
FishC 发表于 2024-3-11 18:12
时间序列数据的统计特性,如均值和方差,可能会随着时间而变化,意味着在不同的时间点上,数据的平均水 ...

请再举个例子解释

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-12 21:08:33 | 显示全部楼层
对于一个时间序列输入x维度是(8,96,8)batch-norm所做的操作是怎样的,batch-norm中求的均值的维度是不是(1,1,8)

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-12 21:09:22 | 显示全部楼层

对于一个时间序列输入x维度是(8,96,8)layer-norm所做的操作是怎样的,layer-norm中求的均值的维度是不是(1,96,1)

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-12 21:12:13 | 显示全部楼层
FishC 发表于 2024-3-12 21:09
在深度学习中,Layer Normalization(层归一化)是一种用于对神经网络中的每一层进行归一化的方法。对 ...

对归一化后的数据进行缩放和平移操作。通过乘以一个可学习的参数gamma(缩放因子)和加上一个可学习的参数beta(平移因子),将归一化后的数据映射回原始的分布。为什么要有这一步

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-12 21:15:30 | 显示全部楼层
StandardScaler.fit()是什么归一化

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-12 21:18:08 | 显示全部楼层
FishC 发表于 2024-3-12 21:15
StandardScaler.fit()是一种数据预处理方法,用于归一化数据。归一化是将数据转换为特定范围内的值,使 ...

这个数据预处理跟layer-norm,batch-norm有什么区别

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-12 21:22:41 | 显示全部楼层
FishC 发表于 2024-3-12 21:09
在深度学习中,Layer Normalization(层归一化)是一种用于对神经网络中的每一层进行归一化的方法。对 ...

layer-norm均值和方差的维度是(8,96,1)吗

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-12 21:24:52 | 显示全部楼层
对于一个时间序列输入x维度是(8,96,8)layer-norm所做的操作是怎样的,layer-norm中求的均值的维度是(8,96,1)吗

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-13 14:40:02 | 显示全部楼层
该错误源于数据加载器中不正确的实现。具体来说,测试数据加载器使用 drop_last=True ,这可能会排除很大一部分测试数据,尤其是大批量数据,从而导致不公平的模型比较。请详细解释一下,在时间序列预测中上述内容的意思

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-13 14:42:29 | 显示全部楼层
FishC 发表于 2024-3-13 14:40
在时间序列预测中,我们通常将数据集分成训练集和测试集,用训练集来训练模型,然后用测试集来评估模型 ...

From:

preds = np.array(preds)
trues = np.array(trues)
inputx = np.array(inputx) # some times there is not this line, it does not matter
To:

preds = np.concatenate(preds, axis=0)
trues = np.concatenate(trues, axis=0)
inputx = np.concatenate(inputx, axis=0) # if there is not that line, ignore this
If you do not do this, it will generate an error during testing because of the dimension 0 (batch_size) is not aligned. Maybe this is why everyone is dropping the last batch. But concatenate them on the 0 axis (batch_size) can solve this problem.为什么要做这样的修改

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-13 14:51:08 | 显示全部楼层
FishC 发表于 2024-3-13 14:42
这个修改的目的是将预测结果(preds)、真实值(trues)和输入数据(inputx)的维度进行调整,以便在测 ...

np.array`将预测结果、真实值和输入数据转换为数组。这样做虽然可以将它们转换为NumPy数组对象,但是有可能会导致维度的错乱。详细解释一下,最好举个例子

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-15 09:17:20 | 显示全部楼层
对于一个时间序列数据(8,96,8)进行max-min norm操作是如何做的,过程中max的维度是怎样的

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-15 09:20:17 | 显示全部楼层
FishC 发表于 2024-3-15 09:17
嗨!对于一个时间序列数据进行max-min norm操作,需要按照以下步骤进行:

1. 找到时间序列数据中的 ...

对于一个时间序列数据维度为(8,96,8)进行max-min norm具体是在哪个维度执行的操作,可视化一下,过程中max的维度是怎样的

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2024-3-15 09:23:00 | 显示全部楼层
对于一个时间序列数据维度为(8,96,8)其中8代表batch的大小,96是时间步长,8代表每个时间步的特征,进行max-min norm具体是在哪个维度执行的操作,可视化一下,过程中max的维度是怎样的

@FishC
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-9-21 08:28

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表