大數據時代心得體會(通用13篇)

來源:瑞文範文網 1.58W

大數據時代心得體會 篇1

這本書裏主要介紹的是大數據在現代商業運作上的應用,以及它對現代商業運作的影響。

大數據時代心得體會(通用13篇)

《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然後在通過解釋在對未來進行預測,並對未來可能出現的問題提出自己看法與對策。

下面來重點介紹《大數據時代》這本書的主要內容。

《大數據時代》開篇就講了Google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了20xx年美國的H1N1的爆發地與傳播方向以及可能的潛在患者的事情。Google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發一兩個周之後纔可以弄到相關的數據。同時Google的預測與政府數據的相關性高達97%,這也就意味着Google預測數據的置信區間爲3%,這個數字遠遠小於傳統統計學上的常規置信區間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近於總體的時候,通過計算得到的描述性數據將無限的趨近於事件本身的性質。而之前採取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因爲之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們採取抽樣的方式來測量事物。而互聯網終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成爲大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。

接下來,維克多又通過了IBM追求高精確性的電腦翻譯計劃的失敗與Google只是將所有出現過的相應的文字語句掃描並儲存在詞庫中,所以無論需要翻譯什麼,只要有聯繫Google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以Google的電腦翻譯的計劃的成功,表明大數據時代對準確性的追求並不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因爲大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。

之後,維克托又預測了一個在大數據時代催生的重要職業——數據科學家,這是一羣數學家、統計學與編程家的綜合體,這一羣人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一羣傢伙的面前展現得淋漓盡致。所以爲了避免個人隱私在大數據時代被這一羣人利用,維克托建議將這一羣人分爲兩部分,一部分使用數據爲商業部門服務,而另一羣人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個人隱私。

無論如何,大數據時代將會到來,不管我們接受還是不接受!

我覺得《大數據時代》這本書寫的很好,很值得一讀。因爲會給我們很多啓發,比如你在相關的社交網站發表的言論或者照片都很有可能被“數據科學家”們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成爲被預測被引誘的對象。所以說,小心你在網上留下的痕跡。

我喜歡這本書是因爲它給我展現了一個新的世界。

大數據時代心得體會 篇2

信息時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變„„我們這樣評論着的信息時代已經變爲曾經。如今,大數據時代成爲炙手可熱的話題。筆者在這說明信息和數據,只是試圖首先說明信息、數據的關係和不同,也試圖說明,爲什麼信息時代轉變爲了大數據時代?大數據時代帶給了我們什麼?

信息和數據的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態範疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義爲意義的實體,它涉及到事物的存在形式。它是關於事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分爲模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字符和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴於數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。這是否是《大數據時代》一書所未曾闡述的背景材料?

在《大數據時代》一書中,大數據時代與小數據時代的區別:1、思維慣例。大數據時代區別與轉變就是,放棄對因果關係的渴求,而取而代之關注相關關係。也就是說只要知道“是什麼”,而不需要知道“爲什麼”。作者語言絕對,卻反思其本質區別。數據的更多、更雜,導致應用主意只能儘量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認爲數據的用途意在何爲,與數據本身無關,而與數據的解讀者有關,而相關關係更有利於預測未來。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭並進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。4、分析基礎。大數據是在互聯網背景下數據從量變到質變的過程。筆者認爲,小數據時代也即是信息時代,是大數據時代的前提,大數據時代是昇華和進化,本質是相輔相成,而並非相離互斥。

數據未來的故事。數據的發展,給我們帶來什麼預期和啓示?銀行業天然有大數據的潛質。客戶數據、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力„„可以這些都基於數據的收集、整理、駕馭、分析能力,基於脫穎而出的創新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創造“數據融合”,實現“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風雲變換,穩健贏取未來。

大數據時代心得體會 篇3

讀了《大數據時代》後,感覺到一個大變革的時代將要來臨。雖然還不怎麼明瞭到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作爲我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰慄起來。

“在小數據時代,我們會假象世界是怎樣運作的,然後通過收集和分析數據來驗證這種假想。”“隨着由假想時代到數據時代的過渡,我們也很可能認爲我們不在需要理論了。”書中幾乎肯定要顛覆統計學的理論和方法,也試圖通過引用《連線》雜誌主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因爲統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認爲”這樣的保護傘。

近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限於傳統的思維模式和特定領域裏隱含的固有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。

當我們人類的數據收集和處理能力達到拍字節甚至更大之後,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性後,似乎真的可以拋棄以抽樣調查爲基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認爲我們不再需要的”理論上溯,它們幾乎都基於一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!

《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先後變化關係規則。兩者似乎是做同一件事。可大數據要的“不是因果關係,而是相關關係”,“知道是什麼就夠了,沒必要知道爲什麼”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基於因果關係。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。

可我卻不能拭目以待,像旁觀者一樣等着哪一個“脫穎而出”,因爲我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。

其一:量子力學搞了一百多年,爲了處理好混雜性問題,把質量和速度結合到能量上去了,爲了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最後把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關係,因爲爸爸就是爸爸,兒子就是兒子。那麼大數據會不會通過正視混雜性,放棄因果關係最後反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區別在於人有邏輯思維而機器沒有。《大數據時代》也擔心“最後做出決策的將是機器而不是人”。如果真的那一天因爲放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。

還好我知道自己對什麼統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡着覺。自己解決不了就只能依靠專家來指點迷津。

所以想向《大數據時代》的作者提一個合理化建議:把這本書繼續寫下去,至少加一個第四部分——大數據時代的邏輯思維。

大數據時代心得體會 篇4

這本書裏主要介紹的是大數據在現代商業運作上的應用,以及它對現代商業運作的影響。

《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然後在通過解釋在對未來進行預測,並對未來可能出現的問題提出自己看法與對策。

下面來重點介紹《大數據時代》這本書的主要內容。

《大數據時代》開篇就講了Google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了20xx年美國的H1N1的爆發地與傳播方向以及可能的潛在患者的事情。Google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發一兩個周之後纔可以弄到相關的數據。同時Google的預測與政府數據的相關性高達97%,這也就意味着Google預測數據的置信區間爲3%,這個數字遠遠小於傳統統計學上的常規置信區間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近於總體的時候,通過計算得到的描述性數據將無限的趨近於事件本身的性質。而之前採取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因爲之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們採取抽樣的方式來測量事物。而互聯網終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成爲大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。

接下來,維克多又通過了IBM追求高精確性的電腦翻譯計劃的失敗與Google只是將所有出現過的相應的文字語句掃描並儲存在詞庫中,所以無論需要翻譯什麼,只要有聯繫Google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以Google的電腦翻譯的計劃的成功,表明大數據時代對準確性的追求並不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因爲大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。

之後,維克托又預測了一個在大數據時代催生的重要職業——數據科學家,這是一羣數學家、統計學與編程家的綜合體,這一羣人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一羣傢伙的面前展現得淋漓盡致。所以爲了避免個人隱私在大數據時代被這一羣人利用,維克托建議將這一羣人分爲兩部分,一部分使用數據爲商業部門服務,而另一羣人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個人隱私。

無論如何,大數據時代將會到來,不管我們接受還是不接受!

我覺得《大數據時代》這本書寫的很好,很值得一讀。因爲會給我們很多啓發,比如你在相關的社交網站發表的言論或者照片都很有可能被“數據科學家”們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成爲被預測被引誘的對象。所以說,小心你在網上留下的痕跡。

我喜歡這本書是因爲它給我展現了一個新的世界。

大數據時代心得體會 篇5

讀了《大數據時代》後,感覺到一個大變革的時代將要來臨。雖然還不怎麼明瞭到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作爲我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰慄起來。

“在小數據時代,我們會假象世界是怎樣運作的,然後通過收集和分析數據來驗證這種假想。”“隨着由假想時代到數據時代的過渡,我們也很可能認爲我們不在需要理論了。”書中幾乎肯定要顛覆統計學的理論和方法,也試圖通過引用《連線》雜誌主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因爲統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認爲”這樣的保護傘。

近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限於傳統的思維模式和特定領域裏隱含的固有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。

當我們人類的數據收集和處理能力達到拍字節甚至更大之後,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性後,似乎真的可以拋棄以抽樣調查爲基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認爲我們不再需要的”理論上溯,它們幾乎都基於一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!

《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先後變化關係規則。兩者似乎是做同一件事。可大數據要的“不是因果關係,而是相關關係”,“知道是什麼就夠了,沒必要知道爲什麼”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基於因果關係。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。

可我卻不能拭目以待,像旁觀者一樣等着哪一個“脫穎而出”,因爲我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。

其一:量子力學搞了一百多年,爲了處理好混雜性問題,把質量和速度結合到能量上去了,爲了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最後把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關係,因爲爸爸就是爸爸,兒子就是兒子。那麼大數據會不會通過正視混雜性,放棄因果關係最後反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區別在於人有邏輯思維而機器沒有。《大數據時代》也擔心“最後做出決策的將是機器而不是人”。如果真的那一天因爲放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。

還好我知道自己對什麼統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡着覺。自己解決不了就只能依靠專家來指點迷津。

所以想向《大數據時代》的作者提一個合理化建議:把這本書繼續寫下去,至少加一個第四部分——大數據時代的邏輯思維。

大數據時代心得體會 篇6

信息和數據的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態範疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義爲意義的實體,它涉及到事物的存在形式。它是關於事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分爲模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字符和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴於數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。這是否是《大數據時代》一書所未曾闡述的背景材料?

在《大數據時代》一書中,大數據時代與小數據時代的區別:1、思維慣例。大數據時代區別與轉變就是,放棄對因果關係的渴求,而取而代之關注相關關係。也就是說只要知道“是什麼”,而不需要知道“爲什麼”。作者語言絕對,卻反思其本質區別。數據的更多、更雜,導致應用主意只能儘量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認爲數據的用途意在何爲,與數據本身無關,而與數據的解讀者有關,而相關關係更有利於預測未來。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭並進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。4、分析基礎。大數據是在互聯網背景下數據從量變到質變的過程。筆者認爲,小數據時代也即是信息時代,是大數據時代的前提,大數據時代是昇華和進化,本質是相輔相成,而並非相離互斥。

數據未來的故事。數據的發展,給我們帶來什麼預期和啓示?銀行業天然有大數據的潛質。客戶數據、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力„„可以這些都基於數據的收集、整理、駕馭、分析能力,基於脫穎而出的創新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創造“數據融合”,實現“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風雲變換,穩健贏取未來。

大數據時代心得體會 篇7

信息時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變„„我們這樣評論着的信息時代已經變爲曾經。如今,大數據時代成爲炙手可熱的話題。筆者在這說明信息和數據,只是試圖首先說明信息、數據的關係和不同,也試圖說明,爲什麼信息時代轉變爲了大數據時代?大數據時代帶給了我們什麼?

信息和數據的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態範疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義爲意義的實體,它涉及到事物的存在形式。它是關於事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分爲模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字符和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴於數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。這是否是《大數據時代》一書所未曾闡述的背景材料?

在《大數據時代》一書中,大數據時代與小數據時代的區別:1、思維慣例。大數據時代區別與轉變就是,放棄對因果關係的渴求,而取而代之關注相關關係。也就是說只要知道“是什麼”,而不需要知道“爲什麼”。作者語言絕對,卻反思其本質區別。數據的更多、更雜,導致應用主意只能儘量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認爲數據的用途意在何爲,與數據本身無關,而與數據的解讀者有關,而相關關係更有利於預測未來。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭並進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。4、分析基礎。大數據是在互聯網背景下數據從量變到質變的過程。筆者認爲,小數據時代也即是信息時代,是大數據時代的前提,大數據時代是昇華和進化,本質是相輔相成,而並非相離互斥。

數據未來的故事。數據的發展,給我們帶來什麼預期和啓示?銀行業天然有大數據的潛質。客戶數據、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力„„可以這些都基於數據的收集、整理、駕馭、分析能力,基於脫穎而出的創新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創造“數據融合”,實現“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風雲變換,穩健贏取未來。

大數據時代心得體會 篇8

《大數據時代》這本書主要描述的是大數據時代到臨人們生活、工作與思維各方面所遇到的重大變革。

文中清晰的闡述了大數據的基本概念和特點,並列出明確的觀點。不管對於產業實踐者,還是對於政府和公衆機構,都非常具有價值。作者將本書分爲3個部分。第一部分提出了大數據時代處理數據理念上的三大轉變:抽樣等於全體;要效率不要絕對精確;要相關不要因果;第二部分作者從萬事萬物數據化和數據交叉複用的巨大價值兩個方面,講述驅動大數據戰車在材質和智力方面向前滾動的最根本動力;最後一部分,作者描繪了大數據帝國前夜的脆弱和不安,包括產業生態環境、數據安全隱私、信息公正公開等問題。

本書觀點擲地有聲,作者觀念高屋建瓴,從很多實例和經驗中萃取普適性觀念。例子詳實豐富,囊括了進百個學術和商業實例。

引言提出了大數據將給生活、工作于思維帶來重大的變革。一個例子是20xx年H1N1流行病毒背景下谷歌通過檢測檢索詞條,處理了4.5億個不同的數據模型,通過預測並與20xx年、20xx年美國疾控中心記錄的實際流感病例進行對比後,確定了45條檢索詞條組合,並將其用於一個特定的數學模型後,預測的結果與官方數據的相關係數高達97%。按照傳統的信息返回流程,通告新流感病毒病例將有一到兩週的延遲。對於飛速傳播的疾病,信息滯後兩週是致命的。而谷歌運用大數據技術,以前所未有的方式,通過海量數據分析得出流感所傳播的範圍,爲世界預測流感提供了一種更快捷的預測工具。此外,我聯想到原淘寶董事長馬雲通過大量數據分析得出20xx年經濟疲弱,爲其商家提前做好迎接經濟危機提供了時間緩衝。(補充並清晰描述詳細)關於大數據在商業領域的應用, Farecast公司是一個成功的典型範例。該公司由奧倫·埃齊奧尼創辦,利用機票的銷售數據來預測未來的機票價格,旨在幫助用戶在購買機票方面做出預測,並對機票價格走勢預測的可信度標示出來供消費者查考。Farecast系統利用近十萬億條價格記錄預測的準確度達75%,使得使用Farecast票價預測工具購買機票的旅客,平均每張機票節約50美元。而處理如此多的數據離開了大數據技術將無法進行。

也正是由於我們進入了一個前所未有的信息化時代,人們擁有了如此多的數據,才提供給我們利用大數據的分析處理手段,創造新的價值。也許有人以爲我們大數據時代的還未來臨。其實大數據技術早已滲透到我們中間,它被應用在垃圾郵件的過濾,新浪微博技術平臺,谷歌翻譯以及輸入文字的自動糾錯等。

文中提出的一個觀點是,預測是大數據的核心。其實從過去的時代人們就利用掌握的數據進行各種分析,從而對經濟等各方面進行預測、矯正。只是進入了大數據時代人們掌握的數據爆炸性的速度在增長,從而數據的存儲和分析數據分方法成了釋放大數據能量的關鍵。

關於不是隨機樣本而是整體數據中。作者指出了隨機取樣是小數據時代用最少的數據獲取最大價值的做法。作者用大數據與喬布斯的癌症治療例子說明了使用全部數據而非樣本的意義。喬布斯成爲世界上第一個對自身所有DNA和腫瘤DNA進行排序的人。喬布斯曾開玩笑說“我要麼是第一個通過這種方式戰勝癌症的人,要麼就是最後一個因爲這種方式死於癌症的人”。雖然最後難免死於癌症但這種獲得所有數據而不是僅樣本的方法將他的生命延長了幾年。同樣,從事跨境匯款業務的Xoom公司偵破一起犯罪集團的詐騙也是由於使用了整體數據。初此之外,他還列舉了日本“相撲”等來證明使用全體數據的重要性。

作者同時也指出隨着數據使用的越來越多,其得出的結果並一定能越來越精確,畢竟數據不能保證百分之百的正確,特別是大數據時代各種結構化與非結構化類型的數據聚集在一起難免導致結果的不太精確。大數據時代要求我們重新審視精確性的優劣。作者特別舉了谷歌翻譯成功的例子。谷歌翻譯之所以優於IBM的Candide系統並不是因爲它擁有更好的算法機制。和微軟的班科和布里爾一樣,谷歌翻譯增加了各種各樣的數據,並且接受了有錯誤的數據。(其語庫來自於未經過濾的網頁內容,會包含一些不完整的句子、拼寫錯誤、語法錯誤以及其他各種錯誤)

在不是因果關係,而是相關關係的篇章中。作者指出在大數據時代往往知道是什麼要比知道爲什麼來的更實在。作者列舉了林登的亞馬遜推薦系統的成功,證實了大數據在分析相關性方面的優勢以及在銷售中獲得的成功。沃爾瑪也是充分利用並挖掘各類數據信息的先鋒和代表,從以前廣爲人事的啤酒和尿布的案例,以及作者舉的有關蛋撻和颶風天氣的案例,都說明了掌握了相關關係對於其策略的幫助。建立在相關關係分析法基礎上的預測是大數據的核心。Aviva保險公司利用幾百種生活方式的數據,如愛好、長瀏覽網頁等間接的預測出哪些人更可能患高血壓、糖尿病和抑鬱症。UPS國家快遞公司通過使用預測性分析檢測其全美6萬輛車隊。進行防禦性的修理,節約巨大得的成本。這些都充分顯示了大數據在預測方面的優勢。

本書第二部分講的是大數據時代的商業變革。

作者用莫里繪製導航圖的例子告訴我們,遠在信息數字化之前,對數據的運用就已經開始了。莫里利用大量的人力去分析多年保存的航海記錄,他從這些大量的數據中獲取到新的利用價值。繪製的圖表幫助商人節約一大筆錢,使年輕的海員們間接獲取了成千上萬名經驗豐富的航海家的指導。日本先進工業技術研究所越水重臣教授通過安裝壓力傳感器將人屁股特徵數據化,進而形成對乘客身份的特徵識別。這項技術爲汽車防盜系統提供了方案。公司,致力於爲顧客預測商品的價格,通過收集處理海量的價格信息,預測準確率高達77%,幫助顧客在購買一個產品時節約了大約100美元。sor部門通過分析來自210個國家的15億信用卡用戶的650億條交易記錄,分析得出商業發展和客戶消費趨勢,如通過分析發現如果一個人下午四點左右給汽車加油的話,他很可能在接下來的一個小時內去購物或者去餐館吃飯 ,且在這一小時裏大約花費35到40美元。商家正可以利用這個分析結果,在加油的小票背面附加上附近商店的優惠券。

這些例子都證明了大數據蘊藏着巨大的商業價值。根據提供價值的不同來源,大數據價值鏈包括三大構成部分。包括第一種是基於數據本身的公司。這些公司擁有大量數據或者至少可以收集到大量數據,卻不一定有從數據中提取價值或者用數據催生創新思想的技能。第二種是基於技能的公司。它們通常是諮詢公司、技術供應商或者分析公司。它們掌握了專業技能但並不一定擁有數據或者提出數據創性用途的才能。比如說,沃爾瑪和Pop-Tarts這兩個零售商就是藉助天睿公司的分析來獲得營銷點子,天睿就是一家大數據分析公司。第三種是基於思維的公司。皮特.華登,Jetpac的聯合創始人,就是通過想法獲得價值的一個例子,他通過用戶分享到網上的旅行照片來爲人們推薦下一次旅行目的地。對於某些公司來說,數據和技能並不是成功的關鍵。挖掘數據的新價值的創新思維纔是這些公司脫穎而出的優勢所在。

大數據成爲許多公司競爭力的來源,未來可能整個行業的結構會發生改變,大公司和小公司最有可能成爲贏家。如今的核心競爭力在於快速而廉價地進行大量的數據存儲和處理。當然公司要根據自己的情況進行調整。大數據向小數據時代的贏家以及那些線下大公司(如沃爾瑪、聯邦快遞、寶潔公司、雀巢公司、波音公司)提出了挑戰。同時,大數據也爲小公司帶來了機遇。大數據也將會影響國家競爭力。當製造業已經大幅轉向發展中國家,而大家都爭相發展創新行業的時候,工業化國家因爲掌握了數據以及大數據技術,所以仍然在全球競爭中佔據優勢,但這個優勢很難持續。隨着技術的發展,西方世界在大數據技術的優勢將會慢慢消失。對於大公司而言,好消息是大數據技術可以加劇優勝劣汰。一旦公司掌握了大數據,它不但可能超過對手還可能遙遙領先。

文章第三部分講了大數據帶來無數好處的同時帶來的不良影響以及如何面對這些影響。包括如數據的收益的處理問題以及數據中用戶資料的隱私和決策過程帶來的影響。作者在保護個人隱私方面提出了幾種想法。一種是使用數據時徵詢數據所有個人的知曉和授權。第二個技術途徑就是匿名化。作者同時也指出了這兩種方式的難度。一方面收集到的數據可能會被後續的多次利用。另一方面,匿名化會在數據收集越來越多和數據的相互結合關聯使用時變得無效。作者列列舉電影《少數派報告》的情節說明越來越依賴數據時,大數據可能將我們禁錮在可能性之中。當然通過分析犯罪的常發地與常發時間,合理安排警力會對治安防範提供不小的幫助。作者還指出不能盡信數據的分析結果,因爲不能保證獲取分析結果來源的數據準確性。大數據在給我們生活提供便利的同時,也讓隱私保護的法律手段失去了作用。我們必須杜絕對數據的過分依賴。

在高速邁進大數據時代的同時,人類信息管理準則需要重新定位,這將帶動社會核心價值觀的轉變。大數據時代,對原有規範的修修補補已經不足以抑制大數據帶來的風險。保護個人隱私就需要對個人數據處理器對其政策和行爲承擔更多責任。同時必須重新定義公正的概念,以確保人類行爲的自由。作者提出瞭解決這些問題的方向。如個人隱私保護方面,可以讓使用者承擔更多的社會責任。將責任從民衆轉移到數據使用者有很多意義,也有充分的理由。因爲他們更清楚將如何使用數據且是數據應用最大的受益者。關於公正方面簡單的講就是個人可以並應爲他們的行爲而非傾向負責。就像公司有內部會計和外部審計人員一樣,大數據時代,公司將設置專門的人員--內部和外部算法師對大數據活動進行監督。還有可能出現第三方的機構對大數據行爲進行監督和衡量。作者甚至考慮到對大數據存在的壟斷情況進行分析並在反壟斷反面給了建議。最後結語中作者提出大數據提供給人們的只是參考答案,提醒我們在利用這個工具時要銘記人類的作用是無法完全替代的。

大數據時代是信息化社會發展必然趨勢,我們只有緊緊跟隨時代發展的潮流,在技術上、制度上、價值觀念上做出迅速調整並牢牢跟進,才能在接下來新一輪的國際競爭中擺脫受制於人的弱勢境地,才能把握髮展的方向,衝破與西方國家的差距。對於一個國家如此,對於一個企業亦是如此。在如此快速的到來的大數據時代,我們還有很多知識需要學習,許多思維需要轉變,許多技術需要研究。公司的規劃中,也需充分考慮到大數據對於公司的未來發展所帶來的機遇和挑戰。對於掌握大量數據的公司,需要考慮有多少數字化的數據,又有哪些可以通過大數據的分析處理而帶來有價值的用途?比如國內目前的社交網站,購物網站等都掌握了用戶的大量的數據信息。在大數據時代制勝的良藥也許是創新的點子,也許可以利用外部的數據,通過多維化、多層面的分析給其他企業或個人帶來價值。

大數據時代讀書心得體會範文6

“大數據”概念早在1980年就有國外的學者提出,可是最近幾年才廣泛受到大家的關注。當“大數據”這個概念傳到中國的時候,瞬間引起了轟動。隨即,各種有關“大數據”的資料和書籍充斥的我們的視野。隨意打開某個電子商務平臺圖書類頁面,在搜索框中搜索“大數據”三個字,就會出現好多本有關“大數據”的書籍。可是,有一個很有趣的現象就是:幾乎所有的平臺上,出現的第一本關於“大數據”的書籍一定是《大數據時代》。一點進去,這本書推薦欄裏的第一句話就是:迄今爲止全世界最好的一本大數據專著。同時,爲這本書做推薦的都是各行業的精英領袖。所有“大數據”方面的書籍也是這本書銷量最高,評價最好。

我從來不會因爲哪本書暢銷和很多人推薦就盲目跟風的去看一本書。因爲我知道通常在這種情況下選擇一本書,整個閱讀的體會和感受是無法遵從自己的內心的,整個過程都很容易夾雜着別人對這本書的感受。所以通常我讀書的節奏大多都是跟不上“潮流”的,但往往經過風雨洗禮之後沉澱下來的都是精華。坦白講,閱讀這本書的初衷並不是因爲我想從書中獲取到多少大數據方面的精華,只是很想知道對於這麼一個很直白的名詞,作者是怎麼寫出這麼厚的一本書的。這種初衷或許很無知和幼稚,可就是這種“愚蠢”的好奇心,讓我更透徹的看到書中的精華。

在看《大數據時代》這本書之前,我的所有讀後感都是集中在書籍給了我什麼思考。對於這本書的讀後感,除了觀點碰撞之外,我還會加上大部分個人看這本書的體會。因爲這本書,已經完全讓我模糊了大多數人口中的“全世界最好的書”是一種什麼標準。也許《大數據時代》真的無法承載那麼高的讚美!

大數據時代的入門書

看完這本書,我隨意調查了一些閱讀過這本書並且給這本書絕對好評的朋友。詢問他們這本書好在哪裏?大多數的回答是說《大數據時代》這本書讓對大數據一無所知的他們瞭解了大數據這個概念,同時通過很多案例說明原來大數據能有這麼大的用處,影響會有這麼大!僅此而已。我看完這本書最大的感受是這本書分爲上、下兩部分。前120多頁爲上部分,後120多頁爲下部分。之所以說《大數據時代》是一本關於大數據的入門書,是因爲這本書用了前面120多頁的篇幅反覆的強調大數據的出現對社會發展影響很大,並且要人們轉變小數據時代慣有的思想。所以整本書的前半部分就強調大數據時代的三個轉變:1、大數據利用所有的數據,而不再僅僅依靠一小部分數據,不再依賴於隨機採樣。2、大數據數據多,不再熱衷於追求精確性,也不再期待精確性。3、大數據時代不再熱衷於尋找因果關係,而是追求相關關係。所以整個上半部分沒什麼可詳說的。我們重點聊聊本書的後半部分。

既然一直都在強調大數據對我們的意義,總要有具體體現。整本書中,我感觸最大的一個案例就是某公司通過分析大數據發現:新品發佈的時候,舊一代的產品可能會出現短暫的價格上漲。因爲人們在心理上就認爲新產品的推出,舊產品就會便宜,從而就會提高購買量。這個發現和我們平常的心理是完全違背的,而且如果不用數據來證明,直接講道理給大家可能還是無法相信。這就是大數據對我們很多傳統思維的顛覆。一旦涉及到思維的改變,往往就會引起整個社會的大變動。

大數據這個概念的出現,讓大數據逐漸發展形成一條價值鏈。在這條價值鏈上,數據本身、技能和思維是最重要的環節。隨着互聯網技術的發展,越來越多的公司都能收集到大量的數據,這些數據也會越來越公開。可是在這些公司中,不是所有的公司都有從數據中提取價值或者用數據催生創新思想的技能。於是就會出現以下兩種公司,一種是掌握了專業技能但不一定擁有數據或者提出數據創新性用途才能的公司,另一種就是擁有超前思維,懂得怎樣挖掘數據的新價值的創新公司。短時間內,我們可能會感覺擁有創新思維,懂得挖掘出數據新價值的大數據思維是最重要的。可是等到產業成熟之後,所有人都知曉了大數據的意義,所有人便開始挖掘自己的大數據思維。同時,隨着科技的進步,掌握大數據技術的也將成爲常態。所以到後來,整個價值鏈的核心環節還是回到了數據本身。而到那時候,大數據的公開性也就越來越小。

在大談完大數據對人類發展的積極意義之後,作者也考慮到大數據時代的風險。這一部分是作者腦洞大開的精彩之處,同時也是最荒謬的一部分。書中說大數據時代將要懲罰未來犯罪,這樣可以在嫌疑人在可能犯罪之前就把犯罪行爲給防止。這樣的社會,大數據儼然已經延伸到了我們每個人生活的點滴。幾乎我們在生活中所做的一切都在大數據的“監控”之下,我想到那時候,別說我們每個人的隱私已經沒有的了,嚴重一點可以說是我們可能連人都不算了。在我們人的社會屬性中,自由權利是一項很重要的指標。通過大數據懲罰人的未來犯罪已經否定了人的自由選擇能力和人的行爲責任自負。同時,由於數據是永久保存,大數據預測也是通過每個人之前的數據來判斷,所以大數據同樣也否定了人的求善心理。還有,從現在各種大數據預測的結果來看,很多發言人都說大數據不是百分百的準確。所以利用大數據來判斷人的行爲發展已經違背了大數據不追求精確性的特徵,這也是書中自相矛盾的地方。

對於一個新事物,如果能讓大家瞭解這個事物並且對此產生興趣,這已經算是一本不錯的入門書了。

大數據時代的心靈雞湯

從小到大,雞湯對於我們來說一直都挺珍貴的。身體虛弱了,喝點雞湯能夠補充營養。心靈受傷了,看點心靈雞湯可以鼓舞人心。可是近幾年,人們生活水平提高了,營養富餘,雞湯已經不是人們補營養的期待了。同樣,心靈雞湯也是如此。

心靈雞湯其實是一個很虛僞的東西。很多人都被心靈雞湯誘人的外表給迷惑。在我看來,心靈雞湯很大的一個特徵就是:立人的志,但是就不告訴你實現志的方法。很多人每次在失意的時候就喜歡看心靈雞湯,希望能得到慰藉。看完後也覺得醍醐灌頂,感覺整個世界都亮了。但又有幾個人想過喝完這些雞湯之後你除了看似重拾夢想,你還獲得了什麼?你知道怎麼去做嗎?《大數據時代》就是這樣一本書。整本書從頭到尾都在向讀者講述大數據的意義,當然期間也會用相應的案例來證明大數據確實有這樣的能力。但是,整本書從沒有涉及到技術層面的問題。或許對於大數據這種依靠互聯網技術的新事物,即使向讀者講技術,也沒有幾個人看得懂,可是整本書沒有一點關於大數據思維的技能引導。給出的案例中只有少數案例向讀者講述了這個公司爲什麼要利用大數據來解決這種問題,大多數都只是告訴讀者國外某家公司運用大數據得出了某種結論。同時,在本書中文譯作者寫的序裏,強調自己翻譯這本著作的一大優點是可以結合國內的案例來分析書中的理論,結果,看到最後一頁都沒有看到一個國內企業關於大數據運用的案例。

之所以我稱之爲“心靈雞湯”,還有一個原因就是作者在書中大講特講的大數據的作用,事實上按照現在的經濟發展水平和社會文明發展程度是很難實現的。書中很多時候的理論都是要建立在社會各項文明都發展健全的基礎上才能實現。

大數據的“傳銷手冊”

看到這個標題,大家可能會覺得我誇大其詞,受到如此多人好評的書怎麼是“傳銷手冊”呢?對於這個表達,我只想說兩點:1、此說法僅代表我個人觀點,是否認同是個人問題。2、此說法主要針對本書的上部分。

我們都知道傳銷組織在發展下線的前期是要花大力氣去培訓的,也就是洗腦。而對於一個陌生又很難以理解的事物,最好的“洗腦”方式就是重複。《大數據時代》這本書就是運用這種方式,前半部分爲了讓讀者能夠接受“大數據”這個概念,作者反反覆覆提醒讀者大數據不是隨機採樣、不追求精確和不尋找因果關係。同時用很多看似很通俗易懂其實看完後還是不知道說了什麼的案例來讓人信服大數據的作用。書中的後半部分雖然也是用這種方式來感染讀者,可後半部分中作者的暢想和對大數據的威脅分析還是對讀者有一些實質意義的,所以後半部分的“傳銷”影響就不是很重要。

大數據時代是未來的趨勢,這誰都不會否認。大數據改造了我們的生活,改變着我們的世界。不管它是以一種什麼樣的姿態面向世界,它都沒有錯,因爲大數據只是一種工具。但當人類開始質疑甚至恐懼大數據的時候,人類就該思考自己是否利用好這個好工具了。

大數據時代心得體會 篇9

未來的十年,將是大數據引領下的智慧科技時代。不管你是否意識到它的存在,大數據都將越來越快地改變我們這個時代,包括我們的生活方式。

維克托·邁爾-舍恩伯格是最早洞見大數據時代發展趨勢的數據科學家之一。他通過一個大家熟知的事例,來幫助我們理解“大數據”的潛在影響力,那就是四個世紀之前望遠鏡和顯微鏡的發明。望遠鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,它們都是收集海量數據的新工具,因爲這種工具的發明,人們同步更新了分析數據的技術和方法,促進了人們對世界更好的理解。如果說望遠鏡和顯微鏡是測量領域中的一場革命,那麼今天的數據測量就相當於是現代版的望遠鏡、顯微鏡。隨着社交網絡的逐漸成熟,移動帶寬迅速提升,雲計算、物聯網應用更加豐富,以及更多的傳感設備、移動終端接入到網絡,由此產生的數據及數據的增長速度比歷史上的任何時期都要多、都要快。一個大數據的時代,不經意間順理成章地翩然而至。

一、什麼是大數據?

大數據是當前最熱門的話題之一。但什麼是大數據,人們尚未給出確切的定義。首先,“大數據”是相對過去小的、局部性的數據而言的;其次,利用大數據進行分析和工作時,所依據的關於此事儘可能完整的數據,從而“一覽衆山小”,而不是採用局部的小數據,從局部推斷整體。

維克托也並未直接給出大數據的定義。不過,他用三大轉變描述了大數據的特性:

轉變之一:在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機採樣。例如一項針對相撲比賽中非法操縱比賽結果的研究對64000場比賽進行了分析,這算不上一個很大的數字,但由於這是過去十年所有的比賽,所以它是大數據。

轉變之二:由於有了更多的數據,我們可以接受更多的混雜、更多數據上的不精確。如果我們對於一個事物只有50個數據點,那麼每一個數據點都必須非常精確,因爲每個數據點都是有用的;但是如果我們有5000萬個,去掉10個,甚至去掉1000個都沒有太大的問題。

轉變之三:不再探求難以捉摸的因果關係,轉而關注事物的相關關係。分析大數據主要爲了預測未來“是什麼”,而不是“爲什麼”。因爲很多時候我們以爲我們找到了事情背後的原因,實際上卻沒有找到。更多時候知道了“是什麼”就足夠了。例如知道流感將會擴散到哪裏就足夠了,我不需要知道爲什麼;知道什麼時候在網上購買機票能夠獲得最優惠的價格就足夠了,我不需要知道爲什麼此時價格最低。

二、大數據帶來的變化

大數據從根本上改變我們認識世界和改變世界的方式。很多傳統的習慣將被顛覆,很多舊的制度將面臨挑戰。舉例來說:

第一,科學探究的思路和方式受到挑戰

探究是新課程改革中的一個熱詞,是促進學校教學與科學研究相融合的實踐舉措。科學探究的基本路徑是:發現問題,提出假設,制定方案,實踐探究,分析數據,得出結論。之所以會梳理出這樣一個探究的路徑,與我們對問題知曉的信息過少有關。換句話說,對所要研究的事物,我們知道的數據很少,需要從這些很小的數據出發,通過猜想和假設,進行試探性的研究,如果研究得出的結果和自己的假想是一致的,則說明我們的假說是正確的,這些假說會上升爲對該事物描述的知識,我們掌握該事物的數據也隨之增加。

利用測量所獲得的點滴數據,從一個局部來推測世界是怎樣的,這是科學探究的基本思路和方式。長期以來,我們總是通過這樣的方式來認識世界,對其有宗教般的信仰。儘管我們知道,決策者總是先有了想法,纔會提出假設。如果決策者自身對所研究的事情存在着偏見,所提出的假設就很難得到實證的支持,這往往會導致探究花費了很長的時間、很大的物力和財力,也常常勞而無功。但科學研究者還是堅定不移地沿着這條道路前行,學校在教學中也將其作爲科學研究的基本規範來傳授。

在大數據時代,這樣的研究方式收到了極大的挑戰。先舉個事例來說吧。手機輻射是否能夠致癌?關於這個問題,無論我們的假設如何,實驗的設計都很難進行。首先,樣本選擇過少,沒有統計學上的意義;其次,不能拿人做研究對象;第三,短時間的研究很難觀察到變化。有了大數據之後,這樣的難題就可以迎刃而解了。前段時間,丹麥就進行了這樣的研究。丹麥擁有1985年手機推出以來所有手機用戶的數據庫。他們從這個數據庫中分析了1990年至20xx年擁有手機的所用用戶的數據,同時,他們還收集了這一期間醫院收集的所有癌症患者的數據,然後分析手機用戶是否比非手機用戶有更高的癌症發病率。這兩個數據庫本身是完全獨立的,在作分析之前從來沒有想過可以做這樣的研究。結果表明,使用移動用戶和癌症風險增加之間不存在任何關係。20xx年10月,這一研究的結果發表在《英國醫學雜誌》上。

上述的案例告訴我們,在獲得了大量的數據,能夠對事物的整體進行全面的認識之後,假想就沒有意義了,我們可以直接根據全面的數據做出結論。

大數據時代心得體會 篇10

“大數據”概念早在1980年就有國外的學者提出,可是最近幾年才廣泛受到大家的關注。當“大數據”這個概念傳到中國的時候,瞬間引起了轟動。隨即,各種有關“大數據”的資料和書籍充斥的我們的視野。隨意打開某個電子商務平臺圖書類頁面,在搜索框中搜索“大數據”三個字,就會出現好多本有關“大數據”的書籍。可是,有一個很有趣的現象就是:幾乎所有的平臺上,出現的第一本關於“大數據”的書籍一定是《大數據時代》。一點進去,這本書推薦欄裏的第一句話就是:迄今爲止全世界最好的一本大數據專著。同時,爲這本書做推薦的都是各行業的精英領袖。所有“大數據”方面的書籍也是這本書銷量最高,評價最好。

我從來不會因爲哪本書暢銷和很多人推薦就盲目跟風的去看一本書。因爲我知道通常在這種情況下選擇一本書,整個閱讀的體會和感受是無法遵從自己的內心的,整個過程都很容易夾雜着別人對這本書的感受。所以通常我讀書的節奏大多都是跟不上“潮流”的,但往往經過風雨洗禮之後沉澱下來的都是精華。坦白講,閱讀這本書的初衷並不是因爲我想從書中獲取到多少大數據方面的精華,只是很想知道對於這麼一個很直白的名詞,作者是怎麼寫出這麼厚的一本書的。這種初衷或許很無知和幼稚,可就是這種“愚蠢”的好奇心,讓我更透徹的看到書中的精華。

在看《大數據時代》這本書之前,我的所有讀後感都是集中在書籍給了我什麼思考。對於這本書的讀後感,除了觀點碰撞之外,我還會加上大部分個人看這本書的體會。因爲這本書,已經完全讓我模糊了大多數人口中的“全世界最好的書”是一種什麼標準。也許《大數據時代》真的無法承載那麼高的讚美!

大數據時代的入門書

看完這本書,我隨意調查了一些閱讀過這本書並且給這本書絕對好評的朋友。詢問他們這本書好在哪裏?大多數的回答是說《大數據時代》這本書讓對大數據一無所知的他們瞭解了大數據這個概念,同時通過很多案例說明原來大數據能有這麼大的用處,影響會有這麼大!僅此而已。我看完這本書最大的感受是這本書分爲上、下兩部分。前120多頁爲上部分,後120多頁爲下部分。之所以說《大數據時代》是一本關於大數據的入門書,是因爲這本書用了前面120多頁的篇幅反覆的強調大數據的出現對社會發展影響很大,並且要人們轉變小數據時代慣有的思想。所以整本書的前半部分就強調大數據時代的三個轉變:1、大數據利用所有的數據,而不再僅僅依靠一小部分數據,不再依賴於隨機採樣。2、大數據數據多,不再熱衷於追求精確性,也不再期待精確性。3、大數據時代不再熱衷於尋找因果關係,而是追求相關關係。所以整個上半部分沒什麼可詳說的。我們重點聊聊本書的後半部分。

既然一直都在強調大數據對我們的意義,總要有具體體現。整本書中,我感觸最大的一個案例就是某公司通過分析大數據發現:新品發佈的時候,舊一代的產品可能會出現短暫的價格上漲。因爲人們在心理上就認爲新產品的推出,舊產品就會便宜,從而就會提高購買量。這個發現和我們平常的心理是完全違背的,而且如果不用數據來證明,直接講道理給大家可能還是無法相信。這就是大數據對我們很多傳統思維的顛覆。一旦涉及到思維的改變,往往就會引起整個社會的大變動。

大數據這個概念的出現,讓大數據逐漸發展形成一條價值鏈。在這條價值鏈上,數據本身、技能和思維是最重要的環節。隨着互聯網技術的發展,越來越多的公司都能收集到大量的數據,這些數據也會越來越公開。可是在這些公司中,不是所有的公司都有從數據中提取價值或者用數據催生創新思想的技能。於是就會出現以下兩種公司,一種是掌握了專業技能但不一定擁有數據或者提出數據創新性用途才能的公司,另一種就是擁有超前思維,懂得怎樣挖掘數據的新價值的創新公司。短時間內,我們可能會感覺擁有創新思維,懂得挖掘出數據新價值的大數據思維是最重要的。可是等到產業成熟之後,所有人都知曉了大數據的意義,所有人便開始挖掘自己的大數據思維。同時,隨着科技的進步,掌握大數據技術的也將成爲常態。所以到後來,整個價值鏈的核心環節還是回到了數據本身。而到那時候,大數據的公開性也就越來越小。

在大談完大數據對人類發展的積極意義之後,作者也考慮到大數據時代的風險。這一部分是作者腦洞大開的精彩之處,同時也是最荒謬的一部分。書中說大數據時代將要懲罰未來犯罪,這樣可以在嫌疑人在可能犯罪之前就把犯罪行爲給防止。這樣的社會,大數據儼然已經延伸到了我們每個人生活的點滴。幾乎我們在生活中所做的一切都在大數據的“監控”之下,我想到那時候,別說我們每個人的隱私已經沒有的了,嚴重一點可以說是我們可能連人都不算了。在我們人的社會屬性中,自由權利是一項很重要的指標。通過大數據懲罰人的未來犯罪已經否定了人的自由選擇能力和人的行爲責任自負。同時,由於數據是永久保存,大數據預測也是通過每個人之前的數據來判斷,所以大數據同樣也否定了人的求善心理。還有,從現在各種大數據預測的結果來看,很多發言人都說大數據不是百分百的準確。所以利用大數據來判斷人的行爲發展已經違背了大數據不追求精確性的特徵,這也是書中自相矛盾的地方。

對於一個新事物,如果能讓大家瞭解這個事物並且對此產生興趣,這已經算是一本不錯的入門書了。

大數據時代的心靈雞湯

從小到大,雞湯對於我們來說一直都挺珍貴的。身體虛弱了,喝點雞湯能夠補充營養。心靈受傷了,看點心靈雞湯可以鼓舞人心。可是近幾年,人們生活水平提高了,營養富餘,雞湯已經不是人們補營養的期待了。同樣,心靈雞湯也是如此。

心靈雞湯其實是一個很虛僞的東西。很多人都被心靈雞湯誘人的外表給迷惑。在我看來,心靈雞湯很大的一個特徵就是:立人的志,但是就不告訴你實現志的方法。很多人每次在失意的時候就喜歡看心靈雞湯,希望能得到慰藉。看完後也覺得醍醐灌頂,感覺整個世界都亮了。但又有幾個人想過喝完這些雞湯之後你除了看似重拾夢想,你還獲得了什麼?你知道怎麼去做嗎?《大數據時代》就是這樣一本書。整本書從頭到尾都在向讀者講述大數據的意義,當然期間也會用相應的案例來證明大數據確實有這樣的能力。但是,整本書從沒有涉及到技術層面的問題。或許對於大數據這種依靠互聯網技術的新事物,即使向讀者講技術,也沒有幾個人看得懂,可是整本書沒有一點關於大數據思維的技能引導。給出的案例中只有少數案例向讀者講述了這個公司爲什麼要利用大數據來解決這種問題,大多數都只是告訴讀者國外某家公司運用大數據得出了某種結論。同時,在本書中文譯作者寫的序裏,強調自己翻譯這本著作的一大優點是可以結合國內的案例來分析書中的理論,結果,看到最後一頁都沒有看到一個國內企業關於大數據運用的案例。

之所以我稱之爲“心靈雞湯”,還有一個原因就是作者在書中大講特講的大數據的作用,事實上按照現在的經濟發展水平和社會文明發展程度是很難實現的。書中很多時候的理論都是要建立在社會各項文明都發展健全的基礎上才能實現。

大數據的“傳銷手冊”

看到這個標題,大家可能會覺得我誇大其詞,受到如此多人好評的書怎麼是“傳銷手冊”呢?對於這個表達,我只想說兩點:1、此說法僅代表我個人觀點,是否認同是個人問題。2、此說法主要針對本書的上部分。

我們都知道傳銷組織在發展下線的前期是要花大力氣去培訓的,也就是洗腦。而對於一個陌生又很難以理解的事物,最好的“洗腦”方式就是重複。《大數據時代》這本書就是運用這種方式,前半部分爲了讓讀者能夠接受“大數據”這個概念,作者反反覆覆提醒讀者大數據不是隨機採樣、不追求精確和不尋找因果關係。同時用很多看似很通俗易懂其實看完後還是不知道說了什麼的案例來讓人信服大數據的作用。書中的後半部分雖然也是用這種方式來感染讀者,可後半部分中作者的暢想和對大數據的威脅分析還是對讀者有一些實質意義的,所以後半部分的“傳銷”影響就不是很重要。

大數據時代是未來的趨勢,這誰都不會否認。大數據改造了我們的生活,改變着我們的世界。不管它是以一種什麼樣的姿態面向世界,它都沒有錯,因爲大數據只是一種工具。但當人類開始質疑甚至恐懼大數據的時候,人類就該思考自己是否利用好這個好工具了。

大數據時代心得體會 篇11

去年的“雲計算”炒得熱火朝天的,今年的“大數據”又突襲而來。彷彿一夜間,各廠商都紛紛改旗換幟,推起“大數據”來了。於是乎,各企業的CIO也將熱度紛紛轉向關注“大數據”來了。有一張來自《程序員》微博的漫畫很形象。我覺得這張圖,很真實地反映了現實中小企業雲計算,大數據的現狀。

不過話又還得說回來,《大數據時代》是本好書。

當然,很多IT知名人士也大力推薦,寫了好多讀後感來表述對這本書的喜歡沒看此書之前,對所謂大數據的概念基本上是一頭霧水,雖則有了解關注過現在也比較火熱的BI,覺得也差不多,可能就是更多的數據,更細緻的數據分析與數據挖掘。看過此書後,感覺到之前的想法,只能算是中了一小半吧---巨量的數據,而另一前:着眼於數據關聯性,而非數據精確性,或許纔是大數據與現時BI最大的不同,不僅僅是方法,更多的時思想方法。不過坦白講,到底是數據的關聯性重佳,還是數據的精確性更好,還真的需要時間來檢驗一下,至少從現在的數據分析方法來論,更多的傾向於數據的精確性。看完此書,我心中的一些問題:

1.什麼是大數據?

查了查百度百科,是這樣定義的:大數據(bigdata),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、並整理成爲幫助企業經營決策更積極目的的資訊。大數據的4V特點:Volume、Velocity、Variety、Veracity--這個好像是IBM的定義吧。

以個人的觀點來看:數據海量,存儲海量都是大數據的基本原型吧。

2.大數據適合什麼樣的企業?

誠然,大數據的前提是海量的數據,只有擁有巨量的數據資源,方能從中查找出數據的關聯性,纔可以讓通過

專業化的處理,讓其爲企業產生價值。針對電信運營,互聯網應用這樣海量用戶的數據的大企業,也是在應用大數據的道路上擁有得天獨厚的條件,但是針對中小企業呢?銷售訂單數據?若非百年老店,估計數據也是少得可憐,5,能用的可能只有消費者數據了吧。貌似大多數廠商,用來舉例的也就是消費都購買行爲分析爲最多。同樣,在公共事業類的政府機構,大數據的作用也許也能很好的發揮。反而感覺在大多數中小型企業應用大數據,似乎有點大題小作。書中說:大數據是企業競爭力。誠然,數據是一個企業的核心無形資源(利用得好的話),但是否所有的數據,或都換則方式說:所有的企業都以大數據爲競爭力,是否真的合適麼?是否在中小企業中,會顯示得小題大做呢?

3.大數據帶來的影響

當一波又一波的IT技術熱潮源源不斷地向我們鋪面而來的時候,你甚至都沒有做好準備,你都要開始迎接它所給你帶來的影響了。經過物聯網,雲計算的推波助瀾下,大數據開始登場了。但它到底給我們帶來了什麼呢?

1)預測未來書中以Google成功預測了未來可能發生流感的案例來開篇,表明通過大數據的應用,可以爲我們的生活起一個保駕護航的指向標。實質很簡單,技術改變世界。

2)變革商業大數據所帶來的商機,同時會衍生出一系列與大數據相關的商業機遇與商業模式,數據的潛在價值會源源不斷地發揮作用可以容易想到的是未來有專門的數據收集,數據分析,數據生成的一條數據產業鏈產生。影響最大的,當然是IT公司

3)變革思維書中所說:因爲有海量的數據作基礎,未來,我們可能更關注數據的相關,而非精細度。對這條,本人還是持保留意見的。

大數據時代心得體會 篇12

如今說起新媒體和互聯網,必提大數據,似乎不這樣說就OUT了。而且人云亦云的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾——舍恩伯格何許人也?他現任牛津大學網絡學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。他的諮詢客戶包括微軟、惠普和IBM等全球頂級企業,他是歐盟互聯網官方政策背後真正的制定者和參與者,他還先後擔任多國政府高層的智囊。這位被譽爲:大數據時代的預言家“的牛津教授真牛!那麼,這位大師說的都是金科玉律嗎?並不一定,讀大師的作品一定要做些功課纔好讀懂,如果能做足功課又具備相應的理論功底,就能與之進行一場思想上的對話。

一讀

舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分“大數據時代的思維變革”中,舍恩伯格旗幟鮮明的亮出他的三個觀點:一、更多:不是隨機樣本,而是全體數據;二、更雜:不是精確性,而是混雜性;三、更好:不是因果關係,而是相關關係。對於第一個觀點,我不敢苟同。一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對於簡單事實進行判斷的數據分析難道也要採集全體數據嗎?我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認爲一定可以找到一種數理統計方法來進行分析,並不一定需要全部數據。聯繫到舍恩伯格第二個觀點中所說的相關關係,我理解他說的全體數據不是指數量而是指範圍,即大數據的隨機樣本不限於目標數據,還包括目標以外的所有數據。我認爲大數據分析不能排除隨機抽樣,只是抽樣的方法和範圍要加以拓展。

我同意舍恩伯格的第二觀點,我認爲這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思。“大數據的簡單算法比小數據的複雜算法更有效。”更具有宏觀視野和東方哲學思維。對於舍恩伯格的第三個觀點,我也不能完全贊同。“不是因果關係,而是相關關係。”不需要知道“爲什麼”,只需要知道“是什麼”。傳播即數據,數據即關係。在小數據時代人們只關心因果關係,對相關關係認識不足,大數據時代相關關係舉足輕重,如何強調都不爲過,但不應該完全排斥它。大數據從何而來?爲何而用?如果我們完全忽略因果關係,不知道大數據產生的前因後果,也就消解了大數據的人文價值。如今不少學者爲了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。

世間萬物的複雜性多樣化並非非此即彼那麼簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實不然,讀者在閱讀時一定要看清楚他是在什麼語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出“不是因果關係,而是相關關係。”這一論斷時,他在書中還說道:“在大多數情況下,一旦我們完成了對大數據的相關關係分析,而又不再滿足於僅僅知道‘是什麼’時,我們就會繼續向更深層次研究的因果關係,找出背後的‘爲什麼’。”[i]由此可見,他說的全體數據和相關關係都在特定語境下的,是在數據挖掘中的選項。

大數據研究的一大驅動力就是商用,舍恩伯格在第二部分裏討論了大數據時代的商業變革。舍恩伯格認爲數據化就是一切皆可“量化”,大數據的定量分析有力地回答“是什麼”這一問題,但仍然無法完全回答“爲什麼”。因此,我認爲並不能排除定性分析和質化研究。數據創新可以創造價值,這是毫無疑問的。舍恩伯格在討論大數據的角色定位時仍把它置於數據應用的商業系統中,而沒有把它置於整個社會系統裏,但他在第二部分大數據時代的管理變革中討論了這個問題。在風險社會中信息安全問題日趨凸顯,數據獨裁與隱私保護成爲一對矛盾。如何擺脫大數據的困境?舍恩伯格在最後一節“掌控”中試圖回答,但基本上屬於老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結語中所道:“大數據並不是一個充斥着算法和機器的冰冷世界,人類的作用依然無法被完全替代。大數據爲我們提供的不是最終答案,只是參考答案,幫助是暫時的,而更好的方法和答案還在不久的未來。”謝謝舍恩伯格!讓大數據討論從自然科學回到人文社科。由此推斷,《大數據時代》不是最終答案,也不是標準答案,只是參考答案。

此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什麼叫數據?什麼叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什麼不同?讀前做些功課讀起來就比較好懂了。

再讀

概念是研究的邏輯起點,“大數據”到底是什麼?在百度上搜索到的解釋是,“大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、並整理成爲幫助企業經營決策更積極目的的資訊。”大數據的4V特點:數量(Volume)、速度(Velocity)、品種(Variety)和真實性(Veracity)。但舍恩伯格認爲大數據並非一個確切的概念。他在書中的一段詮釋更具人文色彩和社會意義:“大數據是人們獲得新的認知、創造新的價值的源泉;大數據還是改變市場、組織機構,以及政府與公民關係的方法。”[ii]其實,概念的界定要看研究者從哪個角度來研究它而定。

科學家的治學態度是嚴謹的,而人文學家更具有想象力。一些對大數據不甚瞭然的人往往誇大了它的作用,甚至把它神化。舍恩伯格認爲大數據的核心是預測。“大數據不是要教機器像人一樣思考。相反,把數學算法運用到海量的數據上來預期事情發生的可能性。”[iii]舍恩伯格甚至不迴避大數據所產生的負面影響,他在第七章裏談到讓數據主宰一切的隱憂。我覺得這是實事求是的科學態度。在量子力學裏有一個測不準原理:一個微觀粒子的某些物理量(如位置和動量,或方位角與動量矩,還有時間和能量等),不可能同時具有確定的數值,其中一個量越確定,另一個量的不確定程度就越大。它是解釋微觀世界的物理現象,信息社會中的大數據會不會也有類似情況呢?如果我們再把凱文·凱利的《失控》對比來讀的話就更有意思了,這樣我們對整個物質世界及至人類社會就有了更全面更深刻的洞察,從物理王國到生物世界,再到信息社會。從公共衛生到商業應用,從個人隱私到政府管理,大數據無處不在。與此同時,從哪個角度探討用什麼方法研究,舍恩伯格都不會忘記大數據服務人類造福人類的終極目的和價值所在。“大數據並不是一個充斥着運算法則和機器的冰冷世界,其中仍需要人類扮演重要角色。人類獨有的弱點、錯覺、錯誤都是十分必要的,因爲這些特性的另一頭牽着的是人類的創造力、直覺和天賦。偶爾也會帶來屈辱或固執的同樣混亂的大腦運作,也能帶來成功,或在偶然間促成我們的偉大。這提示我們應該樂於接受類似的不準確,因爲不準確正是我們之所以爲人的特徵之一。”[iv]用中國話來說就是“人無完人”,人類在收穫大數據帶來的紅利的同時也要承受它帶來的危害。這不是對立統一的辯證唯物主義?我把它看作帶着歐洲批判學派色彩的科學發展觀。

問題是研究的價值基點,“大數據”不是舍恩伯格研究的問題,而是研究對象,他研究的是數據處理和信息管理問題,同時也討論信息安全和網絡倫理問題,還引發哲學上的思考,哲學史上爭論不休的世界可知論和不可知論轉變爲實證科學中的具體問題。可知性是絕對的,不可知性是相對的。“大數據”之所以爲大是因它引發人類生活、工作和思維的大變革,從這個意義上來看,《大數據時代》的意義不僅在於它討論了若干重大問題,而且對研究者開出了一個問題清單,從而引發更多人來探討這些有趣的問題。

《大數據時代》實際上主要是一本討論數據挖掘的書,數據挖掘與數據分析是不同的概念,數據挖掘一般是指從大量的數據中自動搜索隱藏於其中的有着特殊關係性的信息的過程。數據挖掘通常與計算機科學有關,並通過統計、在線分析處理、情報檢索、機器學習、專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。而數據分析的目的是把隱沒在一大批看來雜亂無章的數據中的信息集中、萃取和提煉出來,以找出所研究對象的內在規律。數據挖掘主要運用計算機來進行處理,而數據分析既要用計算機也要人工分析,是計算機科學與人文價值判斷的統一結合。換言之,《大數據時代》並不是一本討論大數據所有問題的書。

《大數據時代》也是一本討論互聯網發展的書,從數字化到數據化,同時有濃厚的未來學色彩。當文字變成數據,我們進入了互聯網;當方位變成數據,我們進入了物聯網;當溝通變成數據,我們進入了下一代互聯網。一切可量化,萬物皆數據,正是當今互聯網世界的真實寫照。面對於這樣的世界及世界的未來,在《大數據時代》出現最多的詞是“思維”和“方法”,因此也可以把這本書視爲思維科學應用研究的書。

此外,在閱讀此書之前還必須具備一些數據科學的基本知識和基本概念,比如說什麼叫數據?什麼叫大數據?數據分析與數據挖掘的區別,數字化與數據化有什麼不同?讀前做些功課讀起來就比較好懂了。

三讀

今年國慶節前一天,中共中央政治局們來到中關村搞集體學習,調研、講解、討論創新驅動發展戰略。包括、在內的七位全部出動來到中關村,這是歷史上沒有過的,百度、聯想和小米的負責人,有了一次直面最高層彙報工作的機會。雷軍和柳傳志,講解的都是本公司的各種情況,李彥宏則沒有講百度的廣告業務發展得如何好,而是講起了大數據。在講解中,李彥宏認爲大數據有兩個重要價值,一是促進信息消費,加快經濟轉型升級;二是關注社會民生,帶動社會管理創新。這些價值也是目前黨和國家領導人最爲重視的,可見《大數據時代》既有理論價值也有現實意義。

當今大數據正在影響着新聞傳媒業,大數據新聞、大數據營銷、輿情分析、受衆(用戶)研究……數據分析師變身新聞編輯,大數據正改變新聞生產流程、大數據在創造傳媒新業態。“不妨想象一下,隨着數據的進一步增加,坐擁用戶資源的新媒體們完全有能力通過數據挖掘,分析用戶癖好,向電視臺定製一部電視劇甚至向好萊塢定製一部電影。到那個時候,電視臺一如那些家電廠商們,曾經產業鏈的上游‘王者’,將徹底成爲一個產業鏈最低端的內容代工廠。”[v]然而,情形也遠沒有人們想象的那麼樂觀,李彥宏指出目前多數所謂的大數據公司其實還是空殼子,因爲數據還沒有完全開放。他認爲必須在政府層面上推動才能真正實現大數據的開發與利用。我在討論大數據時代的輿情監測與預警時說道:“經典自由主義傳播學說對媒體的定位:秉持公正、客觀立場的媒體被稱爲代表公衆監督政府行爲的‘看門狗’。其實,媒體既是公衆利益也是國家利益的‘看門狗’。要看好門就要瞭望、洞察社情民意,傳統媒體信息反饋渠道單一,視野、人力十分有限。而開放互動的新媒體平臺卻大有可爲。作爲公共信息發佈平臺的微博可以成爲政府及時瞭解社情民意,從而選擇正確治理路徑的‘導盲犬’。”[vi]遺憾的是目前我國的數據平臺還沒有完全開放,真正的大數據時代還沒有到來。

與國內不少教科書寫法的專著相比,國外的書寫得更有趣,尤其是大學者寫的,不僅視野開闊,而且能夠深入淺出。《大數據時代》不到22萬字,卻有上百個學術和商業的實例,豐富翔實的例子讓讀者感到通俗易懂,深奧的理論看起來也不費勁。這恐怕與舍恩伯格既是學者也是專家,既有理論又有實踐有關。反觀我們些學者故弄玄虛而示高明,實際上是把讀者拒之門外。我覺得優秀的科學家也應該是一個科普作家,優秀的學者也應該是一個不錯的傳播者。當然國外學術著作也有一個翻譯問題,這本書譯得還不錯。此外,《大數據時代》還附有不少IT界名流的推薦意見,雖是出版商的發行所爲,對解讀此書也不無益處。

除了《大數據時代》,舍恩伯格還有一本《刪除》也值得一讀。要研究大數據不能只讀一本書,該書譯者周濤教授還推薦了三部國內出版的大數據方面的專著:《證析》、《大數據》、《個性化:商業的未來》。相比《大數據時代》的宏大視野,這些書就大數據某一局部問題給出深刻的介紹和洞見。我也推薦讀一讀中國工程院李國傑院士和中科院計算所副總工程學旗合寫的文章《大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考》。

雖說開卷有益,但是由於每個人的時間精力有限,對於一個研究者來說,不讀什麼書甚至比讀什麼書更重要。我認爲書有三種:有用的書,主要是應用類的專業書;無用的書,主要是形而上的思想類;無字的書,人間百態,社會現實。可偏重但不應偏廢。對於學生來講這三類“書”都該讀一些,對於研究者則要讀哪些解決關鍵問題的書,《大數據時代》就是這樣一部書。當然,並非第一個讀者都是研究大數據的,但進入大數據時代,還有什麼東西與數據完全沒有關係呢?麥肯錫全球研究機構認爲,未來十年裏有12項對經濟發展產生重大影響的技術,其中包括三項新媒體技術:移動互聯網、物聯網和雲計算。這三項新媒體技術都與大數據密切相關,而這些新媒體新技術的發展都影響着當今的新聞傳播業。閱讀此書至少給我們研究新聞傳播學帶來一些啓迪。我覺得一本書的價值不在於讓你頂禮膜拜,而是引發廣泛而深入的討論。

“凡是過去,皆爲序曲。”讀完此書,我們對大數據的認識才剛剛開始。

大數據時代心得體會 篇13

4月13日下午,在湖南大學東樓205參加了關於《大數據時代》的讀書交流活動。通過相互交流學習,使我更深層次的理解了大數據時代的利與弊,機遇和挑戰。在寫心得體會前,我想再重新審視一下關於大數據的歷史沿革和現實意義。

首先,最早提出“大數據”時代到來的是全球知名諮詢公司麥肯錫,麥肯錫稱:“數據,已經滲透到當今每一個行業和業務職能領域,成爲重要的生產因素。人們對於海量數 據的挖掘和運用,預示着新一波生產率增長和消費者盈餘浪潮的到來。”“大數據”在物理學、生物學、環境生態學等領域以及軍事、金融、通訊等行業存在已有時日,卻因爲近年來互聯網和信息行業的發展而引起人們關注。大數據作爲雲計算、物聯網之後又IT行業又一大顛覆性的技術革命。雲計算主要爲數據資產提供了保管、訪問的場所和渠道,而數據纔是真正有價值的資產。企業內部的經營交易信息、物聯網世界中的商品物流信息,互聯網世界中的人與人交互信息、位置信息等,其數量將遠遠超越現有企業IT架構和基礎設施的承載能力,實時性要求也將大大超越現有的計算能力。如何盤活這些數據資產,使其爲國家治理、企業決策乃至個人生活服務,是大數據的核心議題,也是雲計算內在的靈魂和必然的升級方向。

其次,進入20xx年,大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,並命名與之相關的技術發展與創新。它已經上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮官網的新聞,現身在國內一些互聯網主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。數據正在迅速膨脹並變大,它決定着企業的未來發展,雖然很多企業可能並沒有意識到數據爆炸性增長帶來問題的隱患,但是隨着時間的推移,人們將越來越多的意識到數據對企業的重要性。正如《紐約時報》20xx年2月的一篇專欄中所稱,“大數據”時代已經降臨,在商業、經濟及其他領域中,決策將日益基於數據和分析而作出,而並非基於經驗和直覺。哈佛大學社會學教授加里·金說:“這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。”

最後,隨着雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。著雲臺的分析師團隊認爲,大數據(Big data)通常用來形容一個公司創造的大量非結構化和半結構化數據,這些數據在下載到關係型數據庫用於分析時會花費過多時間和金錢。大數據分析常和雲計算聯繫到一起,因爲實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。“大數據”在互聯網行業指的是這樣一種現象:互聯網公司在日常運營中生成、累積的用戶網絡行爲數據。這些數據的規模是如此龐大,以至於不能用G或T來衡量。大數據到底有多大?一組名爲“互聯網上一天”的數據告訴我們,一天之中,互聯網產生的全部內容可以刻滿1.68億張DVD;發出的郵件有2940億封之多(相當於美國兩年的紙質信件數量);發出的社區帖子達200萬個(相當於《時代》雜誌770年的文字量);賣出的手機爲37.8萬臺,高於全球每天出生的嬰兒數量37.1萬……,截止到20xx年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數據公司(IDC)的研究結果表明,20xx年全球產生的數據量爲0.49ZB,20xx年的數據量爲0.8ZB,20xx年增長爲1.2ZB,20xx年的數量更是高達1.82ZB,相當於全球每人產生200GB以上的數據。而到20xx年爲止,人類生產的所有印刷材料的數據量是200PB,全人類歷史上說過的所有話的數據量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了20xx年,全世界所產生的數據規模將達到今天的44倍。

首先,談談大數據帶給生活的轉變。大數據已經是信息產業發展的必然趨勢,可以說,大數據現在已經開始慢慢滲透入我們的生活,如:現在流行的打車軟件、三維立體化社區的建立、某些從事生產銷售的行業利用大數據來優化規模和實現利益最大化。而我們很多人對大數據還很陌生,只是被動的適應着大數據給生活帶來的改變。大數據時代是以雲計算爲基礎的,所以,要實現大數據,相關的很多的硬件設備都要更新換代,信息處理系統、信息傳輸系統、信息反饋系統、信息決策系統都將面臨新的挑戰,相關產業都要重新調整產業結構,在那時,可以誇張的說,信息就是黃金,信息就是石油。大數據時代的到來會解放更多的勞動生產力,勢必將會更加加劇生產力過剩的現狀,社會兩極分化現象會更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數據時代的到來會使人們的生活節奏急速加快,信息的時效性決定了它的流通速率,人們的生活節奏要跟上信息流通的速率,就不得不加快自己的節奏,人們會越來越忙,到那時,就像現在的日本,可能想找個人聽你說說話,真的是一件很難的事。

第二,關於數據管理的看法。大數據時代,數據管理是一件很重要的工作,如何才能避免自己的數據被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防範的意識,不主動泄露信息,要管理好自己身邊的信息設備;技防,就是要運用軟件來管理和處理數據,經常檢查更新數據庫,定時查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數據一定要備份保留,而且應當做到備份與原始文件是物理隔離,無關的信息應當及時刪除,減輕硬盤的壓力。

三、怎麼保護自己的隱私。隱私,顧名思義,就是不願意讓別人看到的東西,所以,在大數據時代,更要管理好自己的隱私,以免對自己和家人造成麻煩和損失。越是隱私的信息,越要遠離網絡,不要再公開的社交網絡儲存和展示個人圖片、資料等信息,免得被非法人士採用和竊取。建議還是用紙質的日記代替電腦日記,避免信息傳播範圍太大,管理好自己的日記本。研發一種新的硬件連接器,總是以隨機碼來保護自己真實IP地址,提高網絡安全的可靠性,加強對聯網信息的管理和保護。

不論我們情不情願,大數據時代都會到來,現實社會是我們高喊着走向大數據時代,其實大數據時代已經向我們走來,所以與其被動接受,不如主動學習,從中找到自己的出路,成爲大數據時代的建設者和受益者。

熱門標籤