馬超 李綱



關鍵詞:三元世界;用戶畫像;城市競爭力;城市大數據;城市評價
隨著工業化和城市化的快速發展,城市高速增長的人口、制造、交通導致了城市發展過程中的一系列問題,如人口過載、交通擁堵、環境破壞、失業問題和公共安全等“城市病”逐步凸顯,而這只是城市化的副作用之一。政府在進行城市管理與調控的實施過程中面臨的挑戰也因此逐步復雜與艱巨。同時,自人類社會進入21世紀以來,在信息技術革命的推動下,以計算機、網絡通信等信息通信技術逐漸融人日常生活中。同時以大數據、數據活化為代表的數據科學與技術開始受到人們的廣泛關注,信息化建設逐步成為發展的重要環節。
與發達國家不同,極高的工業化與城市化水平為信息化建設提供了良好的基礎與平臺,而中國的信息化建設的發展路徑則為信息化、城市化、工業化協同發展。這也為中國的城市管理者帶來了更大的壓力,尋求更加高效與科學的管理決策支持成為痛點。
隨著數字中國建設的不斷邁進,完善基礎信息資源和重要領域信息資源建設的重要性,如何使大數據成為經濟社會發展新的推動力成為科技領域關注的熱點。而在城市化發展過程中,隨著大數據和物聯網的興起,對于城市空間的認知已逐漸從原本的二元空間向三元空間轉變.如圖1所示,城市智能化發展成為趨勢。因此,如何有效地利用大數據防治城市病,如何有效地利用大數據為政府提供城市管理所需要的建設性規劃意見,為城市企業提供商業運營所需要的戰略性決策支持,為城市居民提供更加便捷的生活服務.成為大數據應用和城市發展的重要結合點。
1城市數據畫像的建設背景
1.1CPSS社會物理信息系統
CPSS(社會物理信息系統,Cyber-Physical-Social System)是在CPS(物理信息系統,Cyber-Physical System)的基礎上發展而來,是由我國學者、中國科學院研究員王飛躍于2010年提出_3]。CPS分別代表了Cyber Space(信息空間)、Phvsi.cal Space(物理空間)和Society Space(社會空間),CPSS考慮了現實世界中社會和人的因素,是融合了物理空間、網絡空間和社會空間的一個跨域系統。追本溯源,CPSS理論體現了奧地利哲學家波普爾“三元世界”的理念,即宇宙是由物理世界、精神世界以及觀念世界3個相互作用的世界所構成。信息空間、物理空間、社會空間分別對應觀念、物理、精神世界。3個空間相互作用和影響,并不是相互獨立。
以CPSS為基礎進行研究的主要目的,是將物理空間、社會空間中的元素或數據通過協同感知映射到信息空間,在信息空間進行信息集成與分析,以探求對物理空間和社會空間的反向導控路徑。
1.2用戶畫像
交互設計之父Alan Cooper在1998年出版的《軟件創新之路》中最早提出了用戶畫像這一概念。他認為用戶畫像是根據用戶人口統計信息、社交關系、偏好習慣和消費行為等信息而抽象出來的標簽化畫像,是針對人的真實特征描繪,也是真實用戶的綜合原型。然而,早期用戶畫像并沒有得到特別的關注,一方面是因為信息化程度有限,導致用戶特征數據的獲取難度較大;另一方面,企業營銷方式較為傳統,過多的進行用戶的細化研究并不能為企業帶來直接的利益。
隨著大數據技術的深入研究與應用,以及企業的營銷模式轉型,企業的專注點日益聚焦于怎樣利用大數據來為精準營銷服務,進而深入挖掘潛在的商業價值。于是,“用戶畫像”的概念開始被再次研究。目前,關于用戶畫像的內涵和外延并沒有廣泛認可的權威定義,但有許多技術平臺給出了用戶畫像的具體實施過程,對用戶畫像進行描述。構建用戶畫像的核心工作是對用戶進行“標簽化”處理。
從數據來源來說.這些標簽中部分是可以直接獲取的用戶自身的屬性數據,部分是通過一系列算法或規則挖掘獲得。直接獲得的數據一般都是用戶的個人身份信息,例如電商平臺要求用戶上傳的身份證、學生證、駕駛證、銀行卡等,這樣的數據準確性較高。通過算法和數據挖掘得到的標簽則大多數來源于用戶的行為,例如根據女性用戶長期購買的生活產品,并結合其年齡等信息判定其是否為一個母親,這樣的數據實際意義更強。
從標簽類型來說,一般而言.在構建用戶畫像實現過程中,目前主要包括用戶的屬性、用戶流失和用戶行為3類。用戶屬性特征主要針對用戶的自然屬性特征,如用戶的年齡、性別、職業、學歷、收入、籍貫等靜態數據信息,如新浪微博用戶畫像中,主要從能力、興趣、關系、親密度和自然屬性等角度進行刻畫。
2城市數據畫像的提出
2.1城市數據畫像的設想
前文中提到,在用戶畫像構建過程中,數據可分為兩大類。一類為直接獲得的屬性數據,一類為需要通過進一步進行數據挖掘或數據清洗的行為數據。以日常生活中的體檢為例,我們需要測量身高、體重、視力等,這些數據往往是一個特定的數值,可以直接通過體檢設備直接測量得出,這部分數據為感知數據。然而當我們檢查心電圖、腦電圖時.直接通過體檢設備得出的數據并不直觀,需要對一段時間內的測量數據進行分析與觀察,才能得出結論,這部分數據為認知數據。
感知數據與認知數據都有其特定范圍內的價值。還是以體檢為例,感知數據主要能夠體現人的外在表征,我們可以直觀地得出結論,如可以從身高、體重直接得出高矮、胖瘦等結論,因此感知數據多用于同類間橫向比較。而認知數據主要體現人的內在狀態,結論并不直觀.需要通過分析與整合,最終得出結論,如從脈搏測量發現心率較快,要結合心電圖檢查觀察心跳的變化情況,最終得出是否存在問題,因此認知數據多用于本身狀態的描述。
將感知數據與認知數據的感念映射到城市層面,來進行城市數據畫像的研究。結合前文中提到的城市大數據的分類,也可以對城市大數據進行感知數據和認知數據的分類.這與用戶畫像十分類似.其中感知數據反映城市的基本特征,而認知數據反映城市的運行狀態。
城市數據畫像是用戶畫像應用在城市層面的拓展,是借鑒大數據環境中用戶畫像思想應用在城市研究中的一種探索。用戶畫像的最終目的,是對目標用戶進行潛在行為的分析,以此進行精準地服務與營銷預測,而城市數據畫像的最終目的,則需要考慮城市最主要的3種主體類型:城市管理者、城市企業以及城市居民,這樣才能使最終得到的數據畫像更加具有現實意義。
因此,城市數據畫像是將城市發展過程中所包含的物理世界和人類社會所形成的大數據資源,通過信息組織與融合,在信息空間進行映射,結合綜合標準與指標體系,進行分面建模,最終通過可視化等綜合技術展現的一種技術建構。
2.2城市數據畫像的目的
對城市進行數據畫像的主要目的,是將城市發展過程中所形成的大數據資源通過可視化等綜合技術展現給用戶,保障城市運行安全平穩有序,提高城市突發事件快速反應能力.提升政府管理科學決策水平,提供方便快捷的用戶服務,促進城市產業可持續發展。它的目標是通過大數據的支撐,在科學規劃、實時監控、公眾參與、社會監督和客觀評價這些過程中,使城市的各方面都有更合理的規劃依據;通過物聯網、大數據以及互聯網+的概念與技術,保證城市的管理人員能夠把握城市的運行狀態;依托準確的信息,實現精準治理,提出城市發展問題的智能解決方案和考核機制:通過城市數據畫像的高效服務,向市民提供方便、精準和快捷的服務。
總結來說,就是面向政府的管理規劃,面向企業決策支持,面向民眾的便捷生活。例如,對于在政府的突發事件的處理管理.城市數據畫像要能夠做到時間上的多頻次、空間上的多區域同步顯示,綜合利用視頻監控、傳感器協同、視頻分析以及事件檢測實現有效控制;對于企業的銷售點的布局,城市數據畫像要能夠做到地理數據與自體經營數據、經營環境數據、人流分布數據的系統分析,綜合利用實時反饋的商業流數據,為企業的決策做出直接建議和支持;對于城市居民的出行計劃,城市數據畫像通過實時動態的交通流檢測與歷史數據分析、道路特點分析,能夠為居民直接提供出行計劃建議。
3城市數據畫像的構建
以城市大數據分類整合、城市智慧數據集成,城市分面數據模型構建、城市分面數據畫像分類實現的路徑進行城市數據畫像體系的構建。
3.1城市大數據分類整合
城市大數據是由城市政府、公共機構、企業和個人,采用新一代的信息技術,收集與組織的來自于城市設施、組織以及個人的大量動態和靜態的主體和客體數據。
城市大數據描述了城市中多樣元素的實時狀態,包括建筑、街道、管道、環境、企業、金融、貿易、產業、市場、文化、教育、交通、公共秩序等。因為數據量大、涵蓋面廣,在進行城市大數據研究過程中.往往對城市大數據從城市功能供給側、市政服務需求側以及城市大數據產生原因進行分類。
有學者將城市大數據分為城市傳感數據、用戶生成數據、政府管理數據、私人單元數據、媒體資料數據以及混合關聯數據六大類,并列舉了樣例和數據用戶群,如表1所示,以此為基礎,進行城市數據畫像數據集的數據采集與初步分類.形成統一格式,可供數據分析與挖掘的數據倉庫。
城市大數據來自交換和整合眾多的城市物理空間和人類社會空間中產生的數據,利用這些數據,可以用來判斷各種設施的運行狀況、工業和經濟的發展趨勢,以及城市居民健康、教育、科技和文化之間各種復雜的關系。因此,城市大數據不僅為理解整個城市提供了基本信息,而且在促進城市智能方面發揮著核心作用。
3.2城市智慧數據集成
智慧城市和城市大數據的提出為城市病的治理提供了一個富有潛力的新平臺和多樣化的方案。其中智慧城市提供藍圖與指導,而結合大數據處理技術,可以完成以下兩部分工作。第一,將城市物理空間中的客體,如建筑、道路、車輛、城市管網等,進行數據化描述與感知;第二,將城市社會空間中的城市居民的社會行為,如行政管理、社交網絡等,進行數據化提取與認知。兩者在信息空間進行融合,構成城市大數據。李國杰認為,根據蜜蜂的價值,大數據所扮演的角色類似于“蜜蜂模型(H0neybee M0del)”,即蜜蜂通過采蜜的行為帶來的對農業產量提升的價值,遠遠大于她所產生的蜂蜜的價值。和城市中所有其他人力資源和物質資源一樣.城市大數據已經成為在城市智能化發展和政策導向方面重要的戰略資源。
而對于數量龐大、來源廣泛的城市大數據,除了進行數據分類整合等常規數據處理方法外,我們還需要對數據進行“智慧化”處理。城市數據畫像的目的是進行城市基本特征和運行狀態的可視化展現,最終對城市進行評價,需要標準體系與評價體系的支撐。通常采用智慧城市標準體系與城市競爭力評價體系作為參考.以此來將城市大數據整合為具有深層意義的城市智慧數據。
智慧城市是城市數據畫像提出的重要理論基礎之一,同時也對城市智慧數據集成提供藍圖與指導作用。自2012年以來,智慧城市成為主要國際標準化組織的熱點工作。國家標準委于2014年1月正式印發《關于成立國家智慧城市標準化協調推進組、總體組和專家咨詢組的通知》,加速推進了我國智慧城市標準化建設工作,并推出了完備的智慧城市標準體系,包含總體、支撐技術與平臺、基礎設施、建設與宜居、管理與服務、產業與經濟、安全與保障7個維度。
城市競爭力是在社會環境、經濟結構、價值體系、文化產業、管理制度等多個因素綜合作用下創造和維持的。城市競爭力評價研究由來已久,這些研究成果最終多以城市排行榜體現。各類評價體系的設定主體主要包括政府部門、學術團隊、媒體和企業等。
關于城市競爭力的研究.應該綜合考慮各種因素對城市競爭力的影響,重點關注經濟發展水平、科技創新能力、對外開放水平和經濟結構等因素。湖南大學的李琳等從創新的視角提出了城市競爭力評價的指標體系。上海交通大學的劉新靜等研究人員則從人口、經濟、生活質量、文化和智慧化等5個一級指標出發,通過15個二級指標和38個三級指標構建了中國大都市城市競爭力評價體系,并利用《中國城市統計年鑒》和《中國城市年鑒》以及各個城市的統計年鑒和政府統計公報作為基礎數據源進行了實證研究。
結合城市競爭力的相關研究以及智慧城市評價體系,對城市數據畫像的內容范圍進行了限定,在此基礎上進行城市分面模型的構建。
3.3城市數據分面模型構建
綜合上述研究,將城市數據畫像從基礎環境建設、經濟產業狀況、社會公共服務、城市創新能力4個方面.進行城市數據畫像的模型構建,并按照4個角度,對分面進行細分,如圖2所示:
基礎環境建設:基礎環境建設分面主要內容是對城市的基礎設施、居住環境、交通設施等進行刻畫,具體包括人居環境、地產環境、交通環境和自然環境。
社會公共服務:社會公共服務分面主要內容是對城市的基本社會職能以及基礎服務體系進行刻畫,具體包括教育狀況、衛生醫療水平、文化藝術產業和政府公共服務水平。
經濟產業狀況:經濟產業狀況分面主要內容是對城市的基本經濟狀況、消費以及產業結構等進行刻畫,具體包括基礎經濟水平、居民收入狀況、居民消費支出水平和城市產業結構。
城市創新能力:城市創新能力分面主要內容是對城市的科技資源、創新創業水平以及信息化建設水平進行刻畫,具體包括科技資源占比、創新產業水平、創業環境以及信息化程度。
以上4個分面基本覆蓋了所有城市活動,同時圍繞城市管理者、城市居民和城市產業為核心的城市主體建立觀測點.是我們進行城市數據畫像實際應用的基礎。
3.4城市數據畫像實現模式
城市數據畫像可視化實現階段,基于城市數據畫像分面模型,選取合適的、直觀的、有意義的方式進行可視化展示。
前文中提到,我們需要通過感知數據來描述特征與比較差異,通過認知數據來觀察狀態變化與異常發現。映射到城市層面,我們需要從時空視角對城市數據畫像進行分類。
從地理結構上來說,一座城市可以近似看作一個基于經緯度坐標系的二維空間,通過城市內部各種層次的傳感器,我們可以依據不同的傳感數據,繪制出城市的二維特征圖,如常見的區域熱力圖、監控分布圖等,可以理解為一種城市數據視圖。結合前文中城市數據畫像的分面建模中設計的觀測點,將城市數據視圖進行疊加與處理,就形成了一種最基礎的靜態城市數據畫像應用。
而當我們考慮時間因素時,來自于城市傳感器的城市數據就可以看作對于二維城市空間的動態特性所進行的時間采樣,最終形成的畫像是連續變化的.可以看作是城市數據視圖在時間維度上的連續函數,如圖3所示,一段時間內靜態畫像的疊加,可以形成類似于動圖形式的動態畫像。
因此,根據城市數據畫像的時間維度的不同,可以將城市數據畫像分為靜態畫像和動態畫像。靜態畫像的表現形式可以通俗的理解為一張基于數據可視化呈現的“位圖”,而動態畫像則可以理解為包含了多張靜態圖像的“動圖”。靜態畫像是靜態描繪城市的基本特征,圍繞感知數據,用于城市間風格差異和特點比較,而動態畫像是描述城市的變化規律,圍繞認知數據.用于城市內變化觀察和問題探究。
4城市數據畫像的應用
4.1城市數據畫像的3種應用模式
結合前文中所提到的城市數據畫像所面向的對象為政府管理規劃、企業決策支持、民眾生活服務,因此城市數據畫像應包含3種應用模式。
面向政府管理規劃:面向政府管理規劃的城市數據畫像能夠反映城市發展過程中的問題,如城市基礎設施是否能夠滿足城市發展要求,現有路網建設水平是否達到飽和,如何進行高峰期交通分流及進行高峰預警等。
面向企業決策支持:面向企業決策支持的城市數據畫像能夠反映城市的綜合社會屬性,包括人居環境、經濟發展水平、產能結構分布等,根據綜合變化,為企業決策提供最為合理的決策支持。
面向民眾生活服務:面向民眾生活服務的城市數據畫像能夠反映城市的生活便利程度,如商業區和居民區的分布是否合理、居民出行交通是否便利等。
4.2以城市交通為例的城市數據畫像應用
以構建城市數據畫像之交通畫像為例.城市數據畫像應用如下:
首先,需要對交通大數據進行數據采集與分類。根據數據的來源及采集方式,可將數據分為車輛數據、道路數據、人居數據三大類。其中,車輛數據主要來源于用戶生成數據,包含車輛類型、車輛參數等基礎數據,以及行駛里程、行駛軌跡等運行數據。道路數據主要來源于基建傳感數據,主要包含路網密度、公路里程數、交通設施密度等基礎數據,以及高峰路段、潮汐現象路段、擁堵路段時段等運行數據。人居數據主要來源于政府管理數據和企業私人單元數據,主要包含性別、年齡、住宅、車輛等基礎數據,以及出行時間、路程時間、通行方式等運行數據。
對數據進行分類整合后,結合城市交通相關的評價體系(如城市道路交通運行狀況評價體系,城市綜合交通建設評價體系.城市路網建設評價體系等)與標準體系(如道路運輸標準體系,城市客運標準體系,公路交通工程設施建設標準體系等),以此為基礎進行有效字段篩選,確定數據結構類型,形成交通畫像數據集,構建分面模型。
根據反映城市交通狀況的字段類型,進行時空維度分解,最終形成交通靜態數據畫像(如城市路網密度圖,城市交通監控分布圖,城市交通數據報告等)和交通動態數據畫像(如城市交通流量圖,擁堵路口通行狀況展示,城市交通熱力圖等)進行展示,如圖4所示。
5研究展望
面對信息時代城市化進程中復雜的城市病,智慧城市與城市智能化是實現城市可持續發展的關鍵路徑。隨著面向城市的地球空間信息學與物聯網、云計算等技術持續發展,城市中的自然現象、人類活動與社會動態的觀測能力不斷提升,信息資源研究者獲得了大量的城市信息。城市大數據已經成為城市問題研究與城市科學治理的重要戰略資源。城市數據畫像的相關研究是城市信息學的一種直觀的、可視化的應用模式,以構建可持續發展的智慧城市為導向,對發現城市問題,優化城市管理,具有很高的研究價值與現實意義。