大數據時代圖書電商的機遇與挑戰
2013-11-26 14:49 來源:中國新聞出版網 責編:陳莎莎
- 摘要:
- 隨著移動互聯網、物聯網、云計算等新興技術的發展,社交媒體、智能終端和視頻監控等媒介設施迅速普及,全球數據量呈爆炸性增長。據國際數據公司(IDC)統計,僅2011年全球被創建和復制的數據量即達1.8ZB,相當于有史以來所有印刷材料數據量的近萬倍,而這樣龐大的數據量每兩年將翻一番。
【CPP114】訊:隨著移動互聯網、物聯網、云計算等新興技術的發展,社交媒體、智能終端和視頻監控等媒介設施迅速普及,全球數據量呈爆炸性增長。據國際數據公司(IDC)統計,僅2011年全球被創建和復制的數據量即達1.8ZB,相當于有史以來所有印刷材料數據量的近萬倍,而這樣龐大的數據量每兩年將翻一番。海量數據蘊涵著高昂價值,運用新興技術整合數據已成為惠普、IBM、微軟、阿里巴巴等國際巨頭戰略轉型的重要規劃之一。著名咨詢公司麥肯錫2011年發布名為《大數據:下一個創新、競爭和生產率的前沿》的研究報告,認為數據已經滲透到了每個行業和業務職能領域,逐漸成為重要的生產要素,對海量數據的運用,預示著新一波生產率增長和消費者盈余浪潮形成。2012年3月,美國政府發布了“大數據研究與開發計劃”,將之列為繼“信息高速公路計劃”之后的又一重大科技發展部署。種種現象表明,大數據時代已經來臨。
大數據時代,任何產業和企業組織都面臨著新一輪的機遇和挑戰。由于大數據與互聯網及網民的天然接近性,IT業和營銷行業首當其沖。在出版領域,圖書電商是以IT身份而從事營銷業務的典型代表,如何直面挑戰、乘機求進,不僅事關其自身發展,也與整個出版業未來發展方向息息相關。
大數據的定義、特征與內涵
根據麥肯錫的定義,“大數據”是指無法在一定時間內用傳統數據庫軟件工具對其內容進行抓取、管理和處理的數據集合。之所以“無法”抓取、管理和處理,緣于大數據的四個基本特征。其一,數據量巨大。數據量級已經從GB(千兆字節)和TB(萬億字節)發展到了PB(千萬億字節)、EB(百億億字節)乃至ZB(十萬億億字節)計量的地步。科學家估算,如果將2013年全球存儲的數據刻錄在只讀光盤上,可以堆成五堆,每一堆都伸向月球。其二,數據類型多樣。除少量由傳統數據庫累積的結構化數據之外,還包括各類互聯網、物聯網應用所產生的文字、圖片、視頻、圖像與地理位置信息等半結構化和非結構化數據,后者占比達75%以上。[1]其三,實時快速。數據快速產生、增長和流轉,例如即時通訊工具中產生的數據流,要求實時存儲和處理,如果事后追溯則價值流失。其四,價值高但密度低。大數據包含著大量冗余信息,必須披沙揀金才能有所獲益。例如,社交網站中多數日常交流信息價值稀薄,但聯合國的“全球脈動計劃”在巨量日常信息的基礎上,使用自然語言解密軟件對網民進行“情緒分析”,可以預測失業率、疾病爆發等現象,有益于經濟和社會發展。
原本“無法”抓取、管理和處理的數據集合,如今得以愈來愈多地運用,這是大數據時代的意義所在。因而,“大數據”的內涵,不僅止于“龐大的數據集合”,而且包含對數據的存儲、處理、分享、挖掘、分析等技術與能力。大數據技術中,社交網站、物聯網的應用,使用戶的行為軌跡、情緒變化以至萬事萬物的所處狀態都可以數據化;以Hadoop(能夠對大數據進行分布式處理的軟件框架)為代表的非關系型數據庫系統使不同行業、不同類型數據之間的聯系、交換和利用更加便捷;云計算等分布式運算架構技術使快速、低成本分析巨量數據成為可能。大數據內涵的核心,事實上在于如何應用大數據。這正如《駕馭大數據》的作者BillFranks(比爾·弗蘭克斯)所說:“重要的不是數據,而是如何使用數據;大數據的核心是發現價值。”
大數據時代,任何產業和企業組織都面臨著新一輪的機遇和挑戰。由于大數據與互聯網及網民的天然接近性,IT業和營銷行業首當其沖。在出版領域,圖書電商是以IT身份而從事營銷業務的典型代表,如何直面挑戰、乘機求進,不僅事關其自身發展,也與整個出版業未來發展方向息息相關。
大數據的定義、特征與內涵
根據麥肯錫的定義,“大數據”是指無法在一定時間內用傳統數據庫軟件工具對其內容進行抓取、管理和處理的數據集合。之所以“無法”抓取、管理和處理,緣于大數據的四個基本特征。其一,數據量巨大。數據量級已經從GB(千兆字節)和TB(萬億字節)發展到了PB(千萬億字節)、EB(百億億字節)乃至ZB(十萬億億字節)計量的地步。科學家估算,如果將2013年全球存儲的數據刻錄在只讀光盤上,可以堆成五堆,每一堆都伸向月球。其二,數據類型多樣。除少量由傳統數據庫累積的結構化數據之外,還包括各類互聯網、物聯網應用所產生的文字、圖片、視頻、圖像與地理位置信息等半結構化和非結構化數據,后者占比達75%以上。[1]其三,實時快速。數據快速產生、增長和流轉,例如即時通訊工具中產生的數據流,要求實時存儲和處理,如果事后追溯則價值流失。其四,價值高但密度低。大數據包含著大量冗余信息,必須披沙揀金才能有所獲益。例如,社交網站中多數日常交流信息價值稀薄,但聯合國的“全球脈動計劃”在巨量日常信息的基礎上,使用自然語言解密軟件對網民進行“情緒分析”,可以預測失業率、疾病爆發等現象,有益于經濟和社會發展。
原本“無法”抓取、管理和處理的數據集合,如今得以愈來愈多地運用,這是大數據時代的意義所在。因而,“大數據”的內涵,不僅止于“龐大的數據集合”,而且包含對數據的存儲、處理、分享、挖掘、分析等技術與能力。大數據技術中,社交網站、物聯網的應用,使用戶的行為軌跡、情緒變化以至萬事萬物的所處狀態都可以數據化;以Hadoop(能夠對大數據進行分布式處理的軟件框架)為代表的非關系型數據庫系統使不同行業、不同類型數據之間的聯系、交換和利用更加便捷;云計算等分布式運算架構技術使快速、低成本分析巨量數據成為可能。大數據內涵的核心,事實上在于如何應用大數據。這正如《駕馭大數據》的作者BillFranks(比爾·弗蘭克斯)所說:“重要的不是數據,而是如何使用數據;大數據的核心是發現價值。”
- 相關新聞:
- ·愛達森制版:電商思維再升級 新裝備力促新格局 2013.11.21
- ·電商火爆給包裝印刷帶來巨大商機 2013.11.21
- ·電商虛假打折涉嫌違法經營 2013.11.17
- ·電商未能全面替代零售商業 三季度商鋪空置率下降 2013.11.17
- 關于我們|聯系方式|誠聘英才|幫助中心|意見反饋|版權聲明|媒體秀|渠道代理
- 滬ICP備18018458號-3法律支持:上海市富蘭德林律師事務所
- Copyright © 2019上海印搜文化傳媒股份有限公司 電話:18816622098