机器学习中,经常需要打乱数据集,但数据与标签通常是分开存放的,如何同步的打乱它们称为一个问题。
下面给出一种方案。
import numpy
x = np.array([[1, 2], [3, 4], [5, 6]])
y = np.array([1, 2, 3])
index = np.arange(x.shape[0])
np.random.shuffle(index)
x = x[index, :]
y = y[index]
至此,高效的实现了数据与标签的同步打乱。
机器学习中,经常需要打乱数据集,但数据与标签通常是分开存放的,如何同步的打乱它们称为一个问题。
下面给出一种方案。
import numpy
x = np.array([[1, 2], [3, 4], [5, 6]])
y = np.array([1, 2, 3])
index = np.arange(x.shape[0])
np.random.shuffle(index)
x = x[index, :]
y = y[index]
至此,高效的实现了数据与标签的同步打乱。