数据集的打乱方法


机器学习中,经常需要打乱数据集,但数据与标签通常是分开存放的,如何同步的打乱它们称为一个问题。

下面给出一种方案。

import numpy
x = np.array([[1, 2], [3, 4], [5, 6]])
y = np.array([1, 2, 3])
index = np.arange(x.shape[0])
np.random.shuffle(index)
x = x[index, :]
y = y[index]

至此,高效的实现了数据与标签的同步打乱。


文章作者: Kong Aobo
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 Kong Aobo !
  目录