网站流量预测模型 Kaggle

未知
Python
跨平台
2018-02-18
红薯

Kaggle 是一个网站流量预测项目,项目采用Python语言开发,可以给大家的流量预测建模提供一些思路。

数据模型

Kaggle的训练数据集由大约14.5万套时间序列组成,每一套时间序列代表的是每天不同维基百科文章页的浏览次数,时间记录的周期为2015年7月1日到2017年9月10日。而我们的目标是为了预测2017年9月13日到2017年11月13日之间每天的页面浏览量。其中,需要检测的流量包括移动端、桌面端以及爬虫流量。

注:模型的评价指标为SMAPE。

测评方法

使用了一个单一的神经网络来对14.5万套时间序列进行建模,该模型架构跟WaveNet非常相似,主要由扩展卷积和因果卷积网络组成,整个概念如下图所示:

2.gif

为了让数据模型适应并生成整个64天的相干预测值,我们还需要对模型进行一些修改。为了在条件信息不足的情况下尽量减少错误序列信息的生成,我们采用了一种“序列-序列”的方法,其中的编码器和解码器不会共享参数。这样一来,我们就可以在模型生成长序列的情况下让解码器来负责处理积累的噪声了。

下面给出的是一些样本预测,并演示了一些可以捕捉和预测的网络模型。其中,预测值为黄色,灰色的是真实数据值,Y轴为对数变换:

3.png 

4.png

配置要求

12 GBGPU(建议)+Python2.7

Python数据包:

numpy==1.13.1

pandas==0.19.2

scikit-learn==0.18.1

tensorflow==1.3.0 

介绍内容来自 FreeBuf

的码云指数为
超过 的项目
加载中

评论(0)

暂无评论

暂无资讯

暂无问答

Kaggle API 简介

Kaggle API简介 Kaggle是一个数据分析竞赛云计算开放平台,集成了各种数据和计算模块,可以直接将算法模型在上面进行验证,也可以通过其资源学习数据分析的各种方法,或者研究别人的实现方法...

2018/07/25 18:28
27
0
2018-2019时间安排

2018-08 09 整理完大数据的笔记 学习机器学习、python 看kaggle比赛资料——多跑kernel 2018-09 - 寒假前 参加项目 学习机器学习 看kaggle资料 参加各种数据交流大会——积累人脉 2018 - 201...

2018/08/02 21:34
7
0
推荐!国外程序员整理的机器学习资源大全

推荐!国外程序员整理的机器学习资源大全 本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。 C++ 计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器...

2014/12/09 15:01
199
0
称霸Kaggle的十大深度学习技巧

在各种Kaggle竞赛的排行榜上,都有不少刚刚进入深度学习领域的程序员,其中大部分有一个共同点: 都上过Fast.ai的课程。 这些免费、重实战的课程非常鼓励学生去参加Kaggle竞赛,检验自己的能...

2018/08/08 13:42
4
0
21世纪最性感的工作:数据科学家

5年前,“数据科学家”的工作描述还不存在。没人刊登招聘启示寻找数据科学领域里的专家,你在学校里也找不到这个专业。现在,雇主们正在争夺这些专家,而培养这些专家的课程在众多大学里开始...

2014/06/25 18:10
5
0
整理的机器学习资源大全

本文汇编了一些机器学习领域的框架、库以及软件(按编程语言排序)。 伯乐在线已在 GitHub 上发起「机器学习资源大全中文版」的整理。欢迎扩散、欢迎加入。 https://github.com/jobbole/awe...

2016/11/24 17:31
39
0
国外程序员整理的机器学习资源大全

国外程序员整理的机器学习资源大全

2015/08/07 17:26
359
1
第一次参加Kaggle拿银总结

转自:第一次参加Kaggle拿银总结 作者:ScarletPan 我的比赛代码已经放到github --> Kaggle-Rental-Listing-Inquireies 在这篇博客开始之前,我必须感谢导师给我提供服务器资源,@Fenix Lin学...

2018/08/08 00:13
26
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部