天下票仓公布最新数据!看看谁是今年的票房冠军?

我怎么把“天下票仓”的数据挖出来的?

去年年底我就跟隔壁老赵立了个Flag,说今年谁的片子能爆。我说那部扎堆宣传的科幻片肯定不行,他非说能冲到前三。年底了,得找个准数打他脸。媒体上那数据东一块西一块,根本没法信,而且一说“全球”,他们就只算北美和我们自己这边,欧洲和亚洲其他国家的票房全给忽略了,那叫什么全球?

说干就干。要搞真全球数据,那才叫一团麻。一开始我想着找个现成的API或者付费报告,结果发现不是死贵就是数据滞后得厉害,甚至有些报告根本不更新了。靠别人那是靠不住的。

第一步:锁定目标和工具

我干脆放弃了那些花里胡哨的工具,老老实实地开了一堆网页。我的“工具”就是我那台用了五年的Thinkpad,加上一个超大的Excel表格,名字就叫“打脸老赵终极统计表”。

  • 北美:主要盯着那几个大的影院联盟报告,他们每周会出总数,但是得自己做累加。
  • 欧洲:欧洲最麻烦,每个国家算法都不一样,我主要抓了英国、法国、德国这三大票仓的官方统计。有些网站的排版,真叫一个绝,简直是上世纪的风格,连个导出按钮都没有,我硬是一个一个数字盯着屏幕敲进我的Excel表里
  • 亚洲:主要看日韩印尼,数据更新速度飘忽不定,经常是这周有了,下周又撤了,得经常去拉钩。

第二步:汇率大战和数据清洗

最让人头疼的是单位换算。国内是人民币,北美是美元,欧洲有欧元。我得找个统一的汇率基准,不然没法比。我选择了今年的平均汇率作为统一基准,把所有的票房都换算成美元来比较,不然光是汇率波动就能把排名搞得乱七八糟。

光是整理那个Excel表,我就磨了两天。数据源前后拉了十几个,什么专业报告,什么影院内部泄露的小道消息,全都混在一起。我得交叉验证,把那些一看就是吹牛皮的数字剔出去。我这几天盯着那些数字,感觉自己都快变成会计了

第三步:结果出来了,意料之外

等我把所有数据拉平,去除重复,再把宣发费用这种杂七杂八的东西暂时忽略,只看纯票房收入的时候,结果终于出来了。

我发现今年的冠军根本不是我们媒体天天念叨的那几部大制作。那个老赵非说能爆的科幻片,虽然在国内声势浩大,但一拉到全球数据,特别是欧洲和南美那边的表现,直接被拉下去了。

真正的票房冠军,竟然是一部在年中悄悄上映的动画片!那部片子在我们这边排片一般,但是在北美和亚洲其他市场,特别是日本和韩国,简直是横扫。那种稳定且持续的长尾效应,硬生生把那些首周爆炸的大片给超了过去。

我拿着这个最终数据表,给老赵发了过去。他立马给我打电话,说不可能。我说,你只看了国内数据,你看看欧洲那边的数字,人家的假期效应可比我们这边持久多了。他沉默了半天,只说了句:“算你狠,晚上请你吃饭。”

所以说,很多时候,眼见不一定为实,只有自己动手去挖,才能知道真实情况。