这里会显示出您选择的修订版和当前版本之间的差别。
两侧同时换到之前的修订记录 前一修订版 后一修订版 | 前一修订版 | ||
华为:华为 [2018/03/27 21:12] Chris |
华为:华为 [2021/02/17 22:16] (当前版本) |
||
---|---|---|---|
行 54: | 行 54: | ||
* 有哪些比较好的做异常值检测的方法?https://www.zhihu.com/question/38066650 | * 有哪些比较好的做异常值检测的方法?https://www.zhihu.com/question/38066650 | ||
+ | * 异常点检测算法 https://mp.weixin.qq.com/s?__biz=MzIzODExMDE5MA==&mid=2694182460&idx=1&sn=a4842775394946bb643006e2e7c67be9#rd | ||
+ | ====== 第八天(2018年3月28日 周三) ====== | ||
+ | **华为下午4点更新了判题系统。更新前最高分:85.032,同一份文件,更新后得分: 77.158** | ||
+ | * 论坛里说: | ||
+ | <WRAP center round box 80%> | ||
+ | 异常点可能出现在任何日期,不一定是节假日。建议仅从数据规律来判断而不是从日期判断。 | ||
+ | 另外,如果某天没有任何请求数据,训练集里也不会列出这天的数据,会看起来好像是缺失,需要注意。 | ||
+ | 训练数据不会人为制造数据缺失(无论是某个时段、某天、某月等)的情况。 | ||
+ | </WRAP> | ||
+ | |||
+ | * 指数平滑效果不错: | ||
+ | <WRAP center round box 80%> | ||
+ | 初始值的确定,即第一期的预测值。一般原数列的项数较多时(大于15项),可以选用第一期的观察值或选用比第一期前一期的观察值作为初始值。如果原数列的项数较少时(小于15项),可以选取最初几期(一般为前三期)的平均数作为初始值。指数平滑方法的选用,一般可根据原数列散点图呈现的趋势来确定。如呈现直线趋势,选用二次指数平滑法;如呈现抛物线趋势,选用三次指数平滑法。或者,当时间序列的数据经二次指数平滑处理后,仍有曲率时,应用三次指数平滑法。 | ||
+ | </WRAP> | ||
+ | * 待完成:1、二次指数平滑;2、自动根据测试数据计算最佳参数 | ||
+ | |||
+ | ====== 第九天(2018年3月29日 周四) ====== | ||
+ | * 完成二次指数平滑算法,效果不好。。。 | ||
+ | * 完成自动优化参数算法,效果一般。。。 | ||
+ | |||
+ | ====== 第十天(2018年3月30日 周五) ====== | ||
+ | * 开始尝试“随机森林” | ||
+ | * 看到有人用“attention lstm”,初步了解一下。 | ||
+ | * 自动化参数优化,本地运行正常。判题系统运行出错。。。改用Linux运行查错。 | ||
+ | * 设置virtulbox的共享文件夹插件不成功。改搭建一台ftp服务区用于文件传送: | ||
+ | * 先把虚拟机搞到同一个网络里:https://www.cnblogs.com/leezhxing/p/4482659.html | ||
+ | * CentOS7配置FTP服务器增强版~(零基础学会FTP配置) https://www.cnblogs.com/SimonHu1993/articles/7088391.html | ||
+ | * 虚拟机搭建FTP服务器暂时没成功,先在这里中转一下:{{ :zhao_chun_yang_work.tar.gz |}} | ||
+ | |||
+ | ====== 第十一天(2018年3月31日 周六) ====== | ||
+ | * 出现错误提示:{{ :zhaochunyang.tar.gz |}},原因是ecs里面有个'\n'忘了删除了。 | ||
+ | <WRAP center round box 80%> | ||
+ | |||
+ | #### ANSWER RUNTIME EXCEPTION #### | ||
+ | |||
+ | [preliminariesL1usecase01]: "The format of the output file is invalid! Error info: The host number is invalid (not integer)!" | ||
+ | [preliminariesL1usecase02]: "The format of the output file is invalid! Error info: The host number is invalid (not integer)!" | ||
+ | [preliminariesL2usecase01]: "The format of the output file is invalid! Error info: The host number is invalid (not integer)!" | ||
+ | [preliminariesL2usecase02]: "The format of the output file is invalid! Error info: The host number is invalid (not integer)!" | ||
+ | </WRAP> | ||
+ | * 通过测试,分数提升至**78.414** | ||
+ | * 有人(得分89)在排行榜的“团队口号”里写了:价值网络+蒙特卡罗搜索树+GRU+Attention | ||
+ | * 看直播,得到一堆算法的名字:ARMA, ARIMA, GARCH,马尔科夫,指数模型。百度“时间序列预测”可以得到更多信息。 | ||
+ | * clockwork rnn https://arxiv.org/abs/1402.3511 | ||
+ | * 目前看到的最好的RNN、LSTM、GRU博客:Understanding LSTM Networks(翻译) https://blog.csdn.net/xiaopihaierletian/article/details/71214160 | ||
+ | * 手把手教你用 Python 实现针对时间序列预测的特征选择 https://www.leiphone.com/news/201703/6rVkgxvxUumnv5mm.html | ||
+ | |||
+ | ====== 第十二天 (2018年4月1日 周日) ====== | ||
+ | * 改用二次指数平滑,**分数提升至81.977,冲进前20名。** | ||
+ | * 【大数据部落】基于ARIMA、SVM、随机森林销售的时间序列预测 https://blog.csdn.net/qq_19600291/article/details/74217896 | ||
+ | * 手把手教你用 Python 实现针对时间序列预测的特征选择 https://www.leiphone.com/news/201703/6rVkgxvxUumnv5mm.html | ||
+ | |||
+ | ====== 第十三天(2018年4月2日 周一) ====== | ||
+ | * 随机森林random forest及python实现 https://blog.csdn.net/rosefun96/article/details/78833477 | ||
+ | * Python中利用LSTM模型进行时间序列预测分析 https://www.cnblogs.com/arkenstone/p/5794063.html | ||
+ | * 零基础入门深度学习(6) - 长短时记忆网络(LSTM) https://zybuluo.com/hanbingtao/note/581764 | ||
+ | * 如何在Python中从零开始实现随机森林 https://cloud.tencent.com/developer/article/1043093 | ||
+ | * Tensorflow实例:利用LSTM预测股票每日最高价(二) https://blog.csdn.net/mylove0414/article/details/56969181 | ||
+ | |||
+ | ====== 后记 ====== | ||
+ | * 2018年4月9日:[python] 时间序列分析之ARIMA https://blog.csdn.net/u010414589/article/details/49622625 |