02.26 快速上手你的第一个kaggle 比赛吧

注册kaggle

注册登录kaggle以后,你会发现kaggle是一个有着社交属性的类似github 的一个平台, 这个上边有很多关于机器学习(ML)的比赛.而且奖金都非常丰厚. 你可以参加这些比赛,也可在看其他人的比赛成果, 学习知识,增长见识.

kaggle提供很多练习的例子, 我们今天以 Titanic 作为例子,教大家如何参加kaggle 的比赛

加入比赛

第一件事就是找到符合你心意和兴趣的比赛, 比如我们选择Titanic, 这个非常适合新手,是kaggle的官方练习项目. 点击这个专题, 进入以下的界面 选择"Join competion" 加入比赛. 如果你以前加入过这个比赛,那么他会显示"submit predictions"

快速上手你的第一个kaggle 比赛吧

加入比赛


加入以后,会带你进入一个相关规则条款界面. 你选择同意就可以了,这个条款基本上不用读, 它主要说了团队的人数, 提交成果的次数.等等

开始挑战

这个比赛很简单,就是利用Titanic 的乘客信息,预测当时沉船事故中,哪些人会遇难,哪些不会.

关于数据

要事第一, 先看数据, 在页面上,点击data

快速上手你的第一个kaggle 比赛吧

点击data

然后往下滑到最底部, 就看到下边的东东

快速上手你的第一个kaggle 比赛吧

data


这里有三个csv 文件
点击每一个,就可以看看文件中的数据. 比如我们点击train.csv, 这个是用来训练的数据, 有12列,

快速上手你的第一个kaggle 比赛吧

train data


其中有一列是 survived, 显示1是幸存,0是遇难. 还有test.csv 是11列,不包含survived, 使我们要预测的. 最后一个文件 ender_submission.csv, 这个就是一个我们要提交结果的例子. 里边包括passengerid, survived, 两列,我们将这个提交,就会有一个我们的成绩和排名.

第一次提交成果

我们点击 gender_submission.csv 旁边的下载按钮, 将这个文件下载下来,


快速上手你的第一个kaggle 比赛吧

下载文件


回到顶部,我们刚刚点击 join competition的地方,此时这里是 submit predictions, 点击这个蓝色的按钮. 滚动到最底部, 点击上传文件,'upload submission file' 把刚刚下载的文件gender_submission.csv作为你的预测结果,上传上去 点击 make submission

几秒钟以后,就可以了, 你就完成了第一次提交

展示你的ML真正实力

kaggle 提供类似jupyter notebook的编程环境,方便你进行认识数据,进行机器学习.kaggle还提供了GPU, 如果你需要使用的话, 比如要进行深度学习的同学们. 回到开头,点击 Notebook,

快速上手你的第一个kaggle 比赛吧


image.png

你会看到别人公开的自己的成果, 点击创建, create, 你可以选择python 或者R 以及是利用 notebook 还是 code

快速上手你的第一个kaggle 比赛吧


初始化notebook


一般初始化需要几分钟, 名字一般是像:"kernel2daed3cd79"


快速上手你的第一个kaggle 比赛吧

我们可以改名字

快速上手你的第一个kaggle 比赛吧

给文件改名
接下来的使用和jupyter notebook 非常接近
比如

快速上手你的第一个kaggle 比赛吧

加载训练和测试数据

快速上手你的第一个kaggle 比赛吧

快速上手你的第一个kaggle 比赛吧

开始学习

我们使用随机森林吧,非常简单

快速上手你的第一个kaggle 比赛吧

当我们结束学习,且结果输出保存以后, 我们可以点击commit, 在右上角 此时会弹出一个窗口, 等一会, 当程序运行结束以后, 会提示你 open version 这个包含 notebook, data, output comments 四个部分, 点击 output 然后就可以直接提交你的新结果了

快速上手你的第一个kaggle 比赛吧

回到开始的地方

快速上手你的第一个kaggle 比赛吧

可以看自己的排名, 和自己提交了几次, 选择分数高的一次

快速上手你的第一个kaggle 比赛吧

参考: https://www.kaggle.com/alexisbcook/titanic-tutorial


分享到:


相關文章: