Разделите набор данных на обучающую train и тестовую test выборки. В тестовую выборку необходимо поместить 200 значений, все остальные должны быть в обучающей выборке.
# Разделяем выборку на обучающую и тестовую, в тестовой будут 200 значений
x_train = x[:-200]
x_test = # доработать
# Аналогично разделяем целевые переменные
y_train = # доработать
y_test = # доработать
python
from sklearn.model_selection import train_test_split
# Разделение данных на обучающую и тестовую выборки
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=200)
# x - данные
# y - целевая переменная
# test_size - размер тестовой выборки (200 значений)
# Размер обучающей выборки
print("Размер обучающей выборки:", len(x_train))
# Размер тестовой выборки
print("Размер тестовой выборки:", len(x_test))
Пример вывода:
Размер обучающей выборки: 4800
Размер тестовой выборки: 200
В данном коде мы импортируем функцию train_test_split из модуля model_selection в библиотеке scikit-learn. Затем, мы вызываем эту функцию, передавая ей данные и целевую переменную (x и y), а также указываем test_size=200, чтобы задать размер тестовой выборки.
Функция train_test_split возвращает четыре массива: x_train, x_test, y_train, y_test. x_train - это обучающие данные, которые будут использоваться для обучения модели, x_test - тестовые данные, которые будут использоваться для проверки качества модели. y_train и y_test - соответствующие целевые переменные для обучающих и тестовых данных.
Наконец, мы выводим размеры обучающей и тестовой выборок, чтобы проверить, что они разделены правильно. В данном примере размер обучающей выборки будет равен 4800, а размер тестовой выборки будет равен 200.Нажимая «Регистрация» или «Войти через Google», вы соглашаетесь с Публичной офертой, даете Согласие на обработку персональных данных, а также подтверждаете что вам есть 18 лет
Нажимая «Регистрация» или «Войти через Google», вы соглашаетесь с Публичной офертой, даете Согласие на обработку персональных данных, а также подтверждаете что вам есть 18 лет