02.04 kaggle实战之房价预测(一)

一、kaggle简介

kaggle主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台,kaggle已经吸引了80万名数据科学家的关注。是学习数据挖掘和数据分析一个不可多得的实战学习平台,上面还有许多的项目有巨额的奖金,有许多的获奖选手都会分享他们的代码并分析和挖掘数据的经验。如果能在kaggle上面获得一个好的名次,可以为你的求职增添一笔。

二、房价预测

项目地址https://www.kaggle.com/c/house-prices-advanced-regression-techniques房价预测项目是作为kaggle的入门项目,主要是利用回归分析的算法来预测房价。

三、如何参加比赛

kaggle实战之房价预测(一)

1、Data选项

Data主要由三个文件组成分别是sample_submission.csv、test.csv、train.csv和数据组成介绍,可以通过旁边的download按钮下载这些文件。其中sample_submission.csv是提供一个提交数据的组成模板,模板的格式一般的组成形式都是ID+预测结果,我们先通过train.csv中的数据训练出一个模型,然后通过这个模型来预测test.csv中的数据,我们将预测的结果按照提交模板的格式提交数据,提交完成之后你就可以在kaggle的排行榜上查看自己的排名。在Data选项下,我们往下滑动就可以看见数据的介绍

kaggle实战之房价预测(一)

2、kernels选项

kaggle实战之房价预测(一)

kernels里面有很多的选手会分享他们的代码和经验,以及如何来做数据分析、数据挖掘、特征工程等。对于top10+0.2kaggle会给出金牌、前5%会给出银牌、前10%为铜牌。可以根据旁边的选项对kernels进行排序。

3、排行榜(Leaderboard)选项

kaggle实战之房价预测(一)

排行榜分为public Leaderboard和private Leaderboard,两个排行榜的排名方式略有不同。

4、提交结果

kaggle实战之房价预测(一)

点击submit predictions按钮(需要登录之后才能看见按钮),按照模板的形式排列预测结果,点击upload submission file上传自己的结果文件,就可以获取排名。如果提交失败,查看自己的格式是否有问题或尝试再次重新提交。

这篇文章主要介绍了kaggle,以及如何提交自己的结果查看排名,在后面文章将以房价预测项目开始介绍如何来实现一个房价预测模型以及如何做特征工程和数据分析。


分享到:


相關文章: