Недавно мы закончили проект для раздела DSPT2 в курсе Lambda School, работающей на неполный рабочий день. Для моего проекта я решил использовать набор данных Kaggle с продажами видеоигр. Цель проекта – прогнозировать глобальные продажи на основе оценки критиков, количества критиков, издателя, платформы и т. Д.
Для этого проекта я решил сильно опираться на рандомизированную проверку поиска и XGBREGRORSOR XGBOOST (используя MAE
eval_metric
) Тем не менее, я впервые начал с базовой линии средних глобальных продаж для всего набора данных. Это привело меня к базовой линии Мэй
из 0,6605
Анкет
Затем после применения рандомизированного поискового перекрестного валидации к XGBRESRORSOR XGBOOST я закончил с Мэй
из 0,4875
Анкет Это превосходит базовую линию по 0,173
Анкет
Я также написал импорт перестановки всех используемых функций, которые можно просмотреть ниже:
Вот и все. Спасибо за чтение!
Оригинал: “https://dev.to/danieljaouen/lambda-school-data-science-project-fp2”