Global Sources
電子工程專輯
 
電子工程專輯 > 處理器/DSP
 
 
處理器/DSP  

超級電腦突破影像辨識障礙

上網時間: 2015年02月24日     打印版  Bookmark and Share  字型大小:  

關鍵字:超級電腦  影像辨識  CNN  深度學習  神經單元 

超級電腦已經在下棋、撲克牌以及電視智力競賽《危險邊緣》(Jeopardy)中擊敗人腦了,接下來面對的障礙就是影像辨識——在這方面,電腦當然還無法與人腦媲美。如今,微軟宣稱透過編程與演算法可實現比人腦更精確分類與辨識影像的電腦。

2015年的年度ImageNet大規模視覺辨識挑戰賽(ImageNet Large Scale Visual Recognition Challenge)預計將在今年12月17日展開,但競爭已經相當激烈。從現在起預計將會看到一連串的研究報告宣稱能夠超越人腦的視覺辨識能力。例如,在微軟宣佈透過編程使電腦以4.94%的錯誤率勝過人腦的5.1%基準後不久,Google也宣佈其開發成果比微軟更勝0.04%。

微軟演算法範圍
圖中上排表示資料庫中的微軟演算法範圍,第二、三排顯示符合的案例。
(來源:Microsoft)

ImageNet是由史丹佛大學、普林斯頓大學與哥倫比亞大學的研究人員們共同啟動的大規模視覺辨識競賽,約有50個單位參與,提供數以百計的物件範圍以及幾百萬張影像案例。所有的參賽者都利用目前所謂的「深度學習算法」——來自模擬人腦運作方式的各種人工神經網路。大多數的參賽者均提交了詳細描述其演算法的研究論文,解釋為什麼其演算法行之有效。例如,微軟揭示該公司將採用深度卷積神經網路(CNN),Google則透露其免於神經元在初始化過程中飽和的標準化技術。

「先前的研究中,在訓練中的神經單元是手動設計且固定的。相反地,我們讓神經單元採取更靈活的形式使其更具智慧化,」Microsoft Research視覺運算部門首席研究員Jian Sun表示。「更重要的是,每個神經單元的特定形式是經由端至端的訓練學習來的。我們發現,導入更智慧的單元可顯地改善這一模型。」

Sun認為該公司目前的神經網路能夠最先擊敗人類專家,因為其深度學習演算法通常能初始化120萬張訓練影像、試驗5萬張驗證影像,最後再將所學習的應用至主影像資料庫中的10萬張測試影像。再者,微軟採取了略有差異的策略。

「在訓練演算法中需要一種強大的初始化方法,因為訓練非常深度的神經網路是很困難的。以往的研究不是尋求預先訓練就是增加輔助訓練作業。而我們的設計導出一種理論上更完善的初始化方法,讓我們能自由地發揮更強大、更深層也更廣泛的神經網路,」Sun解釋。

Nvidia是年度ImageNet挑戰賽的贊助商和,並為所有參賽者提供了圖形處理單元(GPU)陣列。但微軟並未使用Nvidia GPU,而是另外購買並利用其模擬參數糾正線性單元,從而配置出「首款在影像分類方面擊敗人腦」的超級電腦。

這項研究成果已經被應用到微軟的 Bing 圖片搜尋和 OneDrive 了。以Sun為主導的研究團隊還包括Microsoft Research Asia視覺運算部門的Kaiming He、兩位實習生——西安交通大學的Xiangyu Zhang以及中國科學技術大學的Shaoqing Ren。

編譯:Susan Hong

(參考原文:Microsoft, Google Beat Humans at Image Recognition,by R. Colin Johnson)





投票數:   加入我的最愛
我來評論 - 超級電腦突破影像辨識障礙
評論:  
*  您還能輸入[0]個字
*驗證碼:
 
論壇熱門主題 熱門下載
 •   將邁入40歲的你...存款多少了  •  深入電容觸控技術就從這個問題開始
 •  我有一個數位電源的專利...  •  磷酸鋰鐵電池一問
 •   關於設備商公司的工程師(廠商)薪資前景  •  計算諧振轉換器的同步整流MOSFET功耗損失
 •   Touch sensor & MEMS controller  •  針對智慧電表PLC通訊應用的線路驅動器
 •   下週 深圳 llC 2012 關於PCB免費工具的研討會  •  邏輯閘的應用


EE人生人氣排行
 
返回頁首