Global Sources
電子工程專輯
 
電子工程專輯 > 控制技術/MCU
 
 
控制技術/MCU  

英特爾人類學家談「巨量資料」的秘密和價值

上網時間: 2012年03月13日     打印版  Bookmark and Share  字型大小:  

關鍵字:巨量資料  資料海嘯  雲端  伺服器  物聯網 

雲端運算的物理特性和「野性」資料概念

Bell認為資料本身屬性即具備繁殖(ferality)或複製(reproductive)能力。“資料並不會永遠依照演算法或輸入時的順序整齊排列,在經過雲端運算和其他控制機制後,資料會產生何種變化才是重點所在,因為我們都會嘗試著去控制這些本身即具備「野性」(feral)的資料,”Bell說。

事實上,Bell舉例道,將同一類型的資料全都放在同一種類別中,像是將兔子或其他繁殖力極強的動物放在一起,或許能做出初步有的有效分類。她也指出,由於資料可以很容易地在各個類別間轉移,或是完全轉移到另一種類別,因此上下文(contexts)也可以很容易地轉移,這或許能讓人們試著去管理資料,或是減少這些資料的增殖情況。“在資料世界中,去思考這些策略,是相當有趣的一件事,”她若有所思地表示。

資料的另一個特性在於,儘管資料大多具有明確概念(conceptually),但卻也難以捉摸。例如,「雲端」事實上仍需要許多實體建設。“雲端運算最終都會有一個實體機房。雲端運算資料中心必須是一個實體建築,其中設有伺服器,”Bell強調了實體建設的重要性。

Bell同時強調,雲端運算並不是特殊的概念。“我們思考的不只是單一的雲端系統,我們在想的是許許多多的雲,以及成千上萬的實體設備,包括進行資料分析的伺服器農場(server farm)在內,對我來說,所有這些實體設備,都是研究巨量資料過程中的關鍵部份,”她表示。

而這也對巨量資料的研究提出了諸多問題,包括最終資料是否會無處不在?伺服器農場該設置在何處?這些資料該由何地的何種法律來管轄?採用何種網路運作?以及如何提供和將提供何種服務?

同時,這也讓人們開始思考,是否每件事或每個人都會產生資料,抑或是像William Gibson對網路空間(cyberspace)所下的註解:“未來已然來臨,只是還未廣為人知。”(future was already here but unevenly distributed)

Bell認為,資料將會在各種地方以不同的方式出現,但並非所有情況下的資料都是有用的。“你可以輕鬆地和蘋果(Apple)的 SIRI 對話,看起來這個語音管家似乎頗具智慧性,但基本上我只覺得那是一連串毫無意義的對談,”她說。

再者便是如何處理舊設備和舊資料,這些資料可能尚未數位化,如何處理它們並以新型態來呈現都會是一大問題。

“愈來愈大量的資料不斷地產生出來,但這些資料並不一定出自人類之手,”她指出,即使靜態資料有可能經過處理轉變為動態資訊,但在相反情況下卻不一定會出現同樣的結果。

在全球各地,物聯網(Internet of things, IoT)應用模式都正在發酵,從交通號誌燈到汽車、冰箱、除草機,到固定電話、平板電腦、筆電和電視,所有的裝置都會產生資料,但將來這些資料未必會適合每一個獨立的使用者,Bell說。

例如,有些家庭會共用電話;一些家庭成員在白天工作時使用自己的平板電腦,但夜間或週末時則讓給他們的孩子使用。“我們要如何排序資料,才能得知有多少使用者共用一部設備?”Bell表示,這讓資料排序成為更艱難的任務。

人類資料的特徵──不確定性

然而,開發演算法的噩夢還不僅限於要從這麼多獨立使用者和個別設備中對資料進行排序,Bell表示,更重要的是,你必須牢記,有些資料根本就不是真實的。

她以一份在美國進行的研究為例指出,在該研究的調查對象中,幾乎100%在個人資料中都謊報了約會地點。那麼,如何對這些虛構的資料進行排序,而且讓結果呈現出非常人性化的觀點呢?

“因此,目前人類和機器設備們都會建構資料,但我們會需要演算法來協助建構更有用的資料,”她表示。

“資料基本上只是由0與1組成的字串,這很容易想像,而你所要做的,只是找到適合的工具,盡可能去發揮這些資料的作用。但如果我們停止思考,那麼資料將成為一堆難以想像數位符號。所以,我們要開始想像資料的輪廓,去想像經過處理後,它將會呈現出什麼樣的結果,”她說。“我們正試著以這些資料集為基礎提出建議,但我們卻無法假設所有資料都100%是真實的。”

此外,Bell指出,隨著資料使用者的數量不斷增加,他們對資料的期望也愈來愈高,這些人會希望每一個故事、每一個當下、每一個所產生的資料,都能得到相應的處理。

另一個問題,則是這些資料是否需要被打理得很好,關聯性很強?或是能以散亂型態呈現?

隨著設備、服務、應用程式迅速增加,我們處理資料的經驗也快速累積,同時,隨著雲端運算系統不停增加,巨量資料的概念也正不斷成長,Bell說,這也意味著在資料量持續增長的同時,我們將面對一系列嶄新的挑戰。

但所有這些問題都能得到妥善答覆嗎?或是目前我們仍然未能觸及問題核心?Bell表示,巨量資料代表了“令人難以置信的龐大商機”,它不僅僅是字面上極龐大的數字,它還將對今天的系統架構師、工程師、設備製造商和使用者帶來深遠的影響。

編譯: Joy Teng

(參考原文: Intel's anthropologist discusses the secret life of data ,by Sylvie Barak)


 First Page Previous Page 1 • 2



投票數:   加入我的最愛
我來評論 - 英特爾人類學家談「巨量資料」的秘密和...
評論:  
*  您還能輸入[0]個字
*驗證碼:
 
論壇熱門主題 熱門下載
 •   將邁入40歲的你...存款多少了  •  深入電容觸控技術就從這個問題開始
 •  我有一個數位電源的專利...  •  磷酸鋰鐵電池一問
 •   關於設備商公司的工程師(廠商)薪資前景  •  計算諧振轉換器的同步整流MOSFET功耗損失
 •   Touch sensor & MEMS controller  •  針對智慧電表PLC通訊應用的線路驅動器
 •   下週 深圳 llC 2012 關於PCB免費工具的研討會  •  邏輯閘的應用


EE人生人氣排行
 
返回頁首