Willa
Willa
数据分析新人 Lv 42
好奇心 100 | 学习力 100

不想让自己的Profile里有白色框框

不想让自己的Profile里有白色框框

想要变绿!以及一些版本控制的思考


双十一,一个喜庆的节日;

双十一,一个卧病在家远程装环境的日子;

双十一,一个前一天让自己的Profile空白了的日子。


谁说只有设计师才会被甲方折磨,服务于甲方的模型也活得委曲求全。比如在尝试了100个参数,100个特征构造的方法后,甲方说,还是最初的结果最令人满意(MAPE最低且不筛除他们关注的区域)。这个时候,进度回溯、参数回调、结果重现就是地狱(简称版本控制地狱)

回顾在这个项目里我犯下的程序大忌(指没有留档、不可复现)有以下几点:

  1. 筛选项目时使用了以sys.Date()为标准的筛选条件,可能的后果有以下几点:
    • 同样的数据,在10月和11月的结果不同;
    • 同样的日期,不同更新时间的数据,筛选标准不一,导致结果不同;
  2. 虽然在使用参数后用excel记录了模型表现,并保存了模型输出表,但并没有保存模型输入表,导致无法复现结果,只能批量生成分析报告;
  3. 参数设置的代码分散在不同的scratch.R和console里,难以找回。

同桌给的建议是善用git进行代码控制,在每一次结果输出时都在自己的branch里进行git push,方便追溯代码来源。所以这周六我会主要来研究一下这玩意该怎么搞。

comments powered by Disqus