数据不骗人,但乱读数据骗人

文摘   2024-11-01 23:55   泰国  


肉眼看到的会有偏差

自从老海盗搬来了曼谷,和很多朋友就聊天的话题就容易聊到泰国,但我发现很多朋友都有一个刻板印象,认为泰国的核心产业是农业和国际旅游业。

原因无非:(1)国内市面上的泰国品牌主要集中在农产品上。(2)大多数人对于泰国的印象来源于自然风光纪录片和走马观花的短期旅游等,没有从一个Big picture来观察。

其实泰国的GDP按3大产业类别是这样的,农业占比不到9%。

如果继续拆分是这样:

按泰国2021年统计数据,泰国最大的行业是制造业,大概占GDP 27.4%,和同年的中国一样。第二大行业是批发零售行业,占GDP15.9%。

而旅游业呢?疫情前直接和间接对GDP的贡献最巅峰曾达到过近20%,但现在大约只有12%,且一半的旅游收入其实来源于泰国本土游客的国内旅游。

出口数据其实也能印证,2021年,泰国出口量前三的产品分别是电子产品,电机和电力设备,车辆和车辆零配件。

从各种角度来说,泰国其实都是一个工业化国家,只是这些行业主要都是在给日韩企业做代工,并没有什么太知名的泰国本土品牌,泰国本土也没有赚取太多的利润。

笔者还记得读大学的时候想装机,遇到泰国洪水导致全球机械硬盘价格暴涨。泰国电子行业最辉煌的时候,占了差不多全球80%的机械硬盘产能。

其实整个东亚东南亚整体经济发展基本都是"日本模式”:先通过代工解决就业和积累原始资本,然后利用代工培养的智力人才和原始资本进行产业升级,往产业链上游走,同时转移下游低利润行业去成本更低的地方。

而在东亚经济史上,第一个跑出来的是日本,然后日本转移下游行业去四小龙(韩,台,港,新),四小龙崛起后再转移去四小虎(马泰菲印),但中国的改革开放和加入WTO成了一个新变量,中国能提供更好的营商环境和生产效率,打断了这一过程,产业向中国大陆转移。也就是说四小虎的大规模工业化其实是早于国内的,菲律宾、印尼可能差点,但马来西亚和泰国在中国崛起之前其实已经打下了不错的工业基础。

数据口径一致性

昨天接到一个咨询的电话,甲方是一个地方性的炸鸡品牌,类似于正新鸡排/豪大大鸡排这种低价少SKU的模式, 想进东南亚国家,目标是打透单点城市优先,这位高管这三个月已经跑了东南亚10多个城市有了初步研究才和我通的电话。

其他话题咱不聊,但交流中我发现对方首先排除了吉隆坡,原因是人口太少,打透也没意义。因为:

百度百科出来的吉隆坡只有204万了,远不如已经打透的三个国内地级市任意一个的人口多,所以没多少价值。

但这里其实有一个很大的信息差:国内的行政区划是非常特别的。

国内所谓的地级市是指的是一大片区县的聚合,既有区这种以工商业为主的城市建成区建制,又有由农林鱼牧为主的县域建制。

和国内这种情况类似的就我知道的只有意大利和韩国存在的“广域市”这个概念。

而在大多数国家,市这个级别单指一块高度城镇化,高人口密度以较发达工商业的区域,不恰当的比方更类似于区,但其实比区还要小。

百度百科上显示的人口和面积其实是法律上的吉隆坡,也就是图上被红线框住的一部分建成区。

但其实看卫星地图我们就能看到,以吉隆坡为核心的建成区连绵数十公里,虽然行政区划上绝大部分属于雪兰莪州,但在经济上本来就是和吉隆坡一体化的,有大量快速路和轨道交通连接,而这块区域叫做巴生河谷,总共居住了880万人,略多于杭州城区人口。

更极端的例子是伦敦,传统法律上的伦敦市其实指的是city of London,泰晤士河边一块不到3平方公里,人口1万出头的地方,也就是目前的伦敦金融城。

黄色部分是大伦敦,红色的那一小块就是city of london。而现在我们说的伦敦其实指的是大伦敦,也就是city of london和周围32个城市志愿加入的一个特殊行政单位。

之前很火的这位巴基斯坦老哥其实当选的是大伦敦的市长,组成大伦敦的33个城市都还有各自的市长。

这位才是city of London的市长

而这33个城市组成大伦敦也不过发生在1965年,也就是一代人之前罢了。时至今日,小伦敦的治安还是由City of London Police(伦敦城警察)进行管理,而其他32个城市的治安由Metropolitan Police Service(大都会警察局,也就是《福尔摩斯》里面经常提到的“苏格兰场”)进行管理,且两个单位互不隶属。

理解数据统计方法

原来在某头部APP工作的时候,一直有一个异常数据没有得到解释:当时有一个数据比较重要,也就是DAU/常住人口比,全国主要城市都在这个值都在0.8%-1.0%之间,但是广州是个例外,一直维持在1.2%-1.3%。

其实本质是数据组没有根据各地的特殊情况调整口径。

常住人口的统计在我国除了人口普查阶段外,其他时候都是通过乡/镇/街道一级政府进行的统计上报再结合5年一次的1%人口抽样调查数据和每年一次的1‰抽样数据进行修正。在长三角和北京基本是准确的,当地基层政府的社会控制力非常强。

但珠三角有非常特殊的点:

(1)珠三角地区存在大量偷税漏税隐瞒员工数量的小型黑工厂,这个业态在长三角是非常罕见的,这造成了通过工作地点统计人口的难度很大。

(2)珠三角存在着大量的城中村,但珠三角的城中村组织形式和全国其他地区的城中村完全不一样,其他地方的城中村基本都被街道有效管理起来,但是珠三角的城中村自治程度更高,有限行政能力更多用于处理治安,防火等刚性需要。对于辖区里人口的管理在大多数时间其实是非常模糊的,更依赖房东的自行上报。但因为制造业流水线工的流动性相当大,他们会在不同城中村迁移,且普遍是短租,往往房东还未上报的时候人已经走了。

在广州官方统计1500万常住人口的时候,当时中山大学就已经利用运营商的基站数据和地铁的数据,估测出广州实际居民在2000万左右。

现在的广州也意识到了这个问题,除了全国统一口径的常住人口外,还利用公安,运营商,社保等综合数据,推出了一个新的数据指标——实有人口。根据《广州市公安局关于2023年广州市实有人口构成与分布情况的报告》,广州截至2023年12月31日,全市常住人口1882.70万人,实有人口共2298.18万人。

这就是这个偏差数据的来源,但因为数据组的小伙伴普遍缺乏和底层社会打交道的经验以及城中村生活的经历,更多单纯面向纸面数据,所以一直解不开这个谜团。




老海盗的小酒馆
这是老海盗的航海日记,伙计,看看老海盗经历了什么或许对你也有点帮助。
 最新文章