數據不說謊 大數據之下的世界pdf

2019年7月25日12:24:09 2 111
摘要

專業數據分析團隊“城市數據團”全新力作,“團支書”結合社會熱點,用大數據和數據挖掘分析數據背后的故事。趣味性強,語言幽默,知識豐富,教會讀者用大數據做出正確的判斷。

數據不說謊 大數據之下的世界 內容簡介

這是一本讓你“腦洞大開”的圖書,讓你嘗試從大數據角度來解讀這個世界,你會發現,有些問題,和你的直覺完全不一樣。本書內容分為三部分:第一部分可概括為“腦洞大開”,以淘寶、旅游、餐館取名等不同的角度切入,說明數據可以用于做許多有趣的事情。第二部分數據與工作,包括了做公務員、二三線城市的衰落、創業等若干熱門話題。第三部分數據與生活,包括用數據幫助理解生活現象、用數據挖掘生活中的趣味、以及用數字看房市三個專題。

數據不說謊 大數據之下的世界 目錄

第1章 數據,另一種視角 / / 0011.1數據之下的中國 / / 003

1.1.12015年,中國人是怎么花錢的 / / 003

1.1.2游遍全國,我們的假期夠嗎 / / 017

1.1.3淘寶改變了哪些城市 / / 025

1.2數據之下的城市 / / 35

1.2.1人口疏解,讓城市更擁堵 / / 035

1.2.2在上海上班,地鐵和開車哪個快 / / 048

1.2.3上海餐館取名大法 / / 056

第2章 數據之于工作 / / 0672.1學習/就業指南 / / 069

2.1.1好好學習,是另一種童年 / / 069

2.1.2應該去哪里買書呢 / / 077

2.1.3月薪多少才配坐高鐵 / / 086

2.1.4哪些公務員最辛苦 / / 095

2.1.5奔赴大城市,還是回家鄉 / / 103

2.2在創業的風口上 / / 112

2.2.1一個估值10億美元的養豬O2O項目 / / 112

2.2.2大鵬豬肉,為紅燒而生 / / 121

2.2.3如何在上海開一家靠譜的餐館 / / 130

2.2.4快捷連鎖酒店選址的空間陷阱 / / 140

第3章 數據之于生活 / / 153
3.1理性生活: 那些你所不知道的事 / / 155

3.1.1你的消費水平給上海拖后腿了嗎 / / 156

3.1.2如何面對注定平庸的人生 / / 165

3.1.3下雨天外賣會變多嗎 / / 175

3.1.4“雙12”規避“假折扣”指南 / / 183

3.1.5上海的水源安全嗎 / / 189

3.1.6“控制人口”——開給上海的一劑毒藥 / / 198

3.2感性生活: 八卦新玩法 / / 212

3.2.1高顏值的人都在哪兒 / / 212

3.2.2中國正在二次元化嗎 / / 221

3.2.3如何像白富美一樣生活 / / 232

3.2.4長三角城市那些不得不說的八卦 / / 242

3.2.5上海哪所高校的吃貨最幸福 / / 249

3.3生活之重: 生為房奴 / / 259

3.3.1上海的房子都被誰買走了 / / 259

3.3.2上海購房攻略 / / 268

3.3.3遙不可及的學區夢 / / 278

3.3.4房地產泡沫有多大 / / 287

附錄1:我們是怎么學會玩城市數據的? / / 297

附錄2:城市數據團工作方法簡介 / / 305

數據不說謊 大數據之下的世界 精彩文摘

第1章

數據,另一種視角你消費嗎?旅游嗎?上班嗎?

你知道別人是怎么消費、怎么旅游、怎么上班的嗎?

我們對于世界和城市的認知,往往來源于自己和身邊其他人的生活經驗。

所以,我們的認知往往是主觀化和碎片化的。

但是,當我們擁有了“數據”這個工具的時候,我們就獲得了重新認識世界的機會。

1.1數據之下的中國

本節內容主要涉及一個主題:如何腦洞大開地搜集和利用各種數據,以非常規的方式呈現出中國經濟發展的三個截面。

數據之下的中國,是一個讓你既熟悉又新鮮的中國。

1.1.12015年,中國人是怎么花錢的

在一波接一波的寒潮侵襲之后,期盼已久的春節假期終于到了。同事同學們紛紛放假回家,連親愛的學姐也不在上海,只留我一個人凄冷地坐在工作臺前,獨自迎接假期前最難熬的幾天。

一個人的時候,總是會想很多。

是的。回首即將逝去的羊年,我感慨萬千。雖然不出意外地又(為什么要加一個又字呢)窮困潦倒地度過了漫長的一年,但幸運的是在這期間認識了不少天南海北的朋友。

因此,雖然還在孤獨地加班,但我仍然心系著祖國人民,安靜地準備完成春節前的最后一項數據工作:

數據不說謊:大數據之下的世界第1章數據,另一種視角0000年度全國消費數據總盤點。

好吧,問題來了——

Q1:2015年,全國人民到底花了多少錢?

2015年全球范圍內可使用銀聯卡商戶共3390萬家,ATM共200萬臺,境外共發行銀聯卡5200萬張。

根據刷卡交易統計,2015年全年,全國人民的刷卡交易總金額達到53.9萬億元。

53.9萬億元,是個什么概念呢?

我們可以想象一下:如果把這53.9萬億元全換成100元的人民幣鈔票,并將其一張一張緊挨著排列起來的話,這些錢大概可以繞地球赤道2100圈;從地球排到太陽的話,可以走一半多一點的路程。

假如這還想象不出來的話,我們可以換個角度來看:

根據國家統計局的數據,2015年,全國GDP總額約為67.7萬億元。也就是說,僅是刷卡消費,全國人民就刷掉了年度國內生產總值的79.6%。

親愛的,你2015年創造了多少GDP?又刷掉了多少份額呢?

算好了嗎?

好的話,我們不妨再來研究一下第二個問題,看看你的消費和全國總體水平相比如何呢?問題來了。

Q2:這53.9萬億元,都是怎么花掉的呢?

首先,讓我們來看看這些錢是在什么時間內被花掉的呢?

我們統計了境內日均刷卡的交易金額,并將其細分到每一個小時。2015年日均逐小時交易曲線見圖11,銀聯卡交易類型占比見圖12。

圖11日均逐小時交易曲線

圖122015年銀聯卡交易類型占比

假如我們把2015年全年濃縮到一天來看的話,可以發現:14:00~15:00和8:00~9:00是全國人民刷卡的高峰時段,分別占全天交易總額的12%與8%。

親愛的,你的卡是不是在這個時段內被刷爆的呢?

看完了交易時間,我們再來看一下交易的類型。我們將年度刷卡交易總金額分配到交易類型上,如下所述。

(1)從全國尺度上來看,最多的刷卡交易金額發生在批發行業,份額第一,大概可以購買16個阿里巴巴。

(2)份額第二的是金融行業,大概可以購買7個中國工商銀行。

(3)份額第三的是零售行業(俗稱買買買),大概可以購買5個沃爾瑪。

也許你會覺得,這種全國宏觀尺度上的消費特征,和個人沒什么關系。那么,我們不妨從個人消費者的角度出發,看一下與市民生活關系最大的消費門類吧。

一般而言,各種消費類型中,與市民生活關系最大的應該是衣食住行金融教育六個大類。結果如何呢?

(1)排名第一:金融。毫無懸念。

(2)排名第二:住房。其交易總額大約是金融類的三分之一。

(3)排名第三:旅游。雖然交易總額排名第三,但也不過是住房類的零頭而已。

(4)排名第四:衣(衣物類零售)。其總額大約是旅游的三分之一。

(5)排名第五:吃(餐飲)。交易總額與衣物類零售不相伯仲。

(6)排名最后:教育。其交易總額大約是餐飲的70%。沒錯,這個結果毫不意外、發人深省。

親愛的,你的消費結構和全國人民相比,究竟怎樣呢?

每個人的消費結構自然千奇百怪。

且不說個人,即使從省市的角度上去區分,也可以看到消費結構上的巨大差異。我們來看看:

Q3:全國各省的消費結構有什么樣的偏好呢?

我們仍然將數據聚焦在衣物、餐飲、住房、旅游、金融和教育六個大類上。然后將各類消費金額占總消費金額的比例作為消費偏好的核心指標,分配到各省,可以得到以下結果。

(1)衣物類消費偏好前五名省市:云南、浙江、甘肅、山西、湖北。

想必云南四季如春,民族眾多,姑娘們想怎么打扮就怎么打扮吧。見圖13。

(2)餐飲類消費偏好前五名省市:海南、上海、西藏、寧夏、北京。

吃貨集聚在上海、北京,這點毫不意外。但沒想到海南、西藏、寧夏等邊遠地區的吃貨能量同樣驚人,見圖14。

圖13各省衣物類消費占比

圖14各省餐飲類消費占比(3)住房類消費偏好前五名省市:海南、四川、貴州、北京、安徽。

非常出乎意料的,前三名竟然不是以高房價著稱的北上廣哦!看來雖然北上廣的絕對房價居高不下,但從真實的消費結構上,海南和四川的房價水平也不容小覷。相比北京排名第四,而上海甚至都沒有擠進前五,見圖15。

圖15各省住房類消費占比

(4)旅游類消費偏好前五名省市:西藏、海南、青海、新疆、云南。

從圖16可以看到,西部的旅游消費偏好明顯高于東部。而排名前五的省市,也都是以旅游勝地著稱的地區。

圖16各省旅游類消費占比

(5)金融類消費偏好前五名省市:福建、重慶、廣東、湖南、上海。

從圖17可以看到,我國東南地區在金融類消費偏好中可謂一枝獨秀,福建省拔得頭籌。排名前五的省市中,上海市已經是最北方的地區了。

圖17各省金融類消費占比

(6)教育類消費偏好前五名省市:陜西、四川、北京、海南、湖南。

從圖18可以看到,陜西省、四川省在教育類消費上的偏好明顯高于全國其他地區。我在想,這些地方的孩子們是不是從幼兒園就開始上補習班了?

圖18各省教育類消費占比

說明一下:本書消費數據中沒有統計到中國臺灣地區的數據,所以地圖上臺灣地區的顏色與其他省市不同。

看完各省的比較,我們不妨再來聚焦北上廣深四個一線城市的情況。

00哪個城市最土豪呢?

從卡均消費金額的平均數來看,

深圳市人民卡均消費金額達到11.7萬元,高居首位;廣州市以7.6萬元居第二位;而上海市以6.4萬元的微弱優勢戰勝北京市的6.3萬元,位居第三。

在感嘆深圳市人民真土豪的同時,你是不是發現自己又拖后腿了?沒關系,我們再來看看中位數,這次數字就變得和諧多了,見圖19。

圖192015年四大城市卡均消費金額(中位數)(單位:元)深圳市人民卡均消費的中位數金額達到20000元,仍然居首,北京市、上海市以15000元并列第二,而廣州市則以11000元收尾。

順便說一句題外話:從刷卡消費特征上看,四個城市的市民最愛的餐飲品牌也截然不同。

(1)北京市民最愛海底撈,熱氣騰騰的火鍋既熱鬧又抵御寒氣。

(2)上海市民則最愛王品,上海市民依然很小資,對牛排情有獨鐘。

(3)廣州市民最愛百勝(肯德基、必勝客的老東家),原來除了當地特色美食,肯德基、必勝客等西式快餐同樣也受市民歡迎。

(4)深圳市民則最愛春滿園,經典粵式老牌餐廳還是深深地征服了深圳人民的胃口,讓其他外來飲食遜色不少。

以上,我們盤點了全國刷卡總交易、各類型及各省市交易的特征。接下來,我們聚焦進入一個更核心的問題:

Q4:2015年,都是哪些人在花錢呢?

我們以上海為參照吧。

我們選出了常住城市在上海、一年中刷卡交易筆數在20筆以上的銀行卡50萬張,作為研究的樣本。并按照性別、年齡將持卡人分為6組,統計其在零售方面的消費特征。

結論來了:

男性花錢多、老人花錢多。

首先,我們不區分消費類別,計算出各個分組的刷卡交易總金額,得到圖110。

圖1102015年交易金額的年齡性別分布

從交易總金額來看,各個分組之間的差異并不太明顯,但仍然可以看到:

(1)消費最多的是老年男性,其次是中年男性和青年男性;

(2)而在女性組中消費能力最強的中年女性,其消費份額也沒能超過男性組中份額最小的青年男性。

這不科學啊!難道女性的花錢能力還不如男性?

我們再計算出每個組別的人均(取中位數,下同)刷卡交易金額,見圖111。

圖111各組持卡人年均交易金額(單位:元)

沒錯,無論在哪個年齡組,男性的人均交易金額都比女性要高。

另外,可怕的是,隨著年齡的增長,男性會花得越來越多!

圖書網:數據不說謊 大數據之下的世界pdf

恭喜,此資源為免費資源,請先
本站所有資源收集于互聯網,只做學習和交流使用,版權歸著作人和出版社所有,請在下載后24小時之內自覺刪除,若作商業用途,請購買正版,由于未及時購買和付費發生的侵權行為,與本站無關。本站發布的內容若侵犯到您的權益,請聯系站長刪除,我們將及時處理!
  • 我的微信
  • 掃一掃加好友
  • weinxin
  • 微信公眾號
  • 掃一掃關注(網站備用地址)
  • weinxin

發表評論

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前評論:2   其中:訪客  2   博主  0

    • 1982465187 1982465187 2

      數據不說謊 大數據之下的世界

      • …… …… 2

        好書