Translate

2015年11月12日 星期四

不需費時分類的Google Photos App為何這麼聰明?

Chris Perry,目前Google相簿搜尋和分析團隊的領導人。(圖/黃慧雯攝)
2015年5月推出的Google Photos App,你使用過了嗎?如果選擇不以原始解析度上傳的話能有無限空間的Google Photos,其實可以讓你上傳你從小到大的所有相片,而且更聰明的是能幫你輕鬆重溫感人回憶。究竟Google Photos怎麼做到的?其實背後有一大部分的技術是仰賴機器學習(Machine Learning)。

機器學習是本回Google亞太區媒體活動的主講重點,在此領域深耕已久的Google透過這個機會向台灣的讀者揭開了一點關於機器學習領域的神秘面紗,這當中的技術也運用在Google Photos App當中。

讀者可以透過Apple App Store或是Google Play下載iOS或是Android版本的Google Photos App(Google相簿App),以自己的Google帳號登入後,基本上你就可以無後顧之憂的將所有手機中的照片備份到Google Photos。而假如你有時間,你還可以看見Google從你上傳的照片影片中,為你製作而成的動態GIF圖片、拼貼照片以及故事集錦等內容。

Google Photos App運用了許多機器學習的技術,讓你僅需要很少的時間就可以輕鬆管理你的相簿,且找到你想重溫的經典回憶。(圖/黃慧雯攝)
此外,更聰明的是,透過機器學習的技術,存於Google Photos當中照片你可以輕鬆找尋得到。透過運用機器學習技術的圖片辨識能力,只要在Google Photos App中按下「放大鏡」的搜尋圖示,你就可以看見Google為你利用不同指標而分類的照片,預設內容包含:人物、地點、事物等等。以人物來說,Google Photos會為你將它判斷是同一個人的照片整合在一起,你還能為這個人物設定特定標籤,且對方不會知曉你採用什麼標籤(你甚至能一鍵就隱藏不想看到的人,例如前男/女友),而同樣的機器學習技術也可辨識你所拍攝的特定主體,例如「天空」、「棒球」等等照片,使用者只需要在Google Photos App中多加查看,就可以看見這些Google已經為你分類好的照片。

當然,除了這些已分類好的內容之外,也可透過Google Photos App的搜尋功能,為你找到特定照片,例如你可以在當中以「我+自拍」的關鍵字,快速找尋到所有你自己的自拍照;且所使用的搜尋關鍵字可以很自然,舉個例子來說,例如「NY Night」。而以編輯目前嘗試的經驗來看,透過英文關鍵字來搜尋的結果比較多也更為準確,身在台灣的使用者目前則只能多練練英文,或是期待Google Photos App的中文搜尋功能再更為提升!順帶一提,這些照片搜尋的功能,主要是透過雲端運算而達成,因此如果你在沒有連網的狀態下,就無法執行這些功能。

對於人們來說,對於辨識物體的學習很快速,例如學習到「…是貓」、「…是狗」的內容。然而,這樣的工作對於機器學習領域來說,背後的技術並不簡單。簡而言之,你若要透過機器學習來判斷某一個知名建築物,在建築物通常外型不會有太大變化的情況下,判斷準確其實相對簡單;對於判斷人臉、動物這類會隨著時間改變的內容,則需要下很大功夫。

Google Photos App背後運用了一個名為Inception的深度學習技術,來協助辨識圖片的內容。(圖/Google提供)
就機器學習物體辨識的內容來看,你需要讓機器擁有「computer vision」,也就是教會機器去辨識所拍攝到的內容。以Google Photos App而言,背後就是運用了一個名為「Inception」的深度學習(deep learning)技術,包含22層神經網絡,每一層都用於辨識圖片中的某一向度,例如顏色、亮度、物體形狀等等,而透過Inception的判斷後,就會為你分類Google Photos中的照片。

當然,可想而知這樣的機器學習技術,仍有不準確之處。例如Google Photos曾經鬧出將一位非裔女性標記為大猩猩的糗事,差點引發種族歧視相關的議論,但Google Photos團隊在得知此事之後,一個小時之內便解決了問題,也讓當事人感到很滿意,算是有個圓滿的結局,且能避免其他的使用者在未來免於遭遇類似事件的困擾。

由此可知,機器學習主要是一個讓程式透過大量範例來學習,而後慢慢演進的更為準確、有效工具的技術。雖然難以得到百分百準確的結果,例如:在Gmail垃圾郵件判斷的例子上,然而透過使用者的回饋、以及長時間的學習時間,還有越來越為準確的機器學習Model,能讓整個系統更為智慧化,有時甚至能讓你感受到「哇!它好聰明」的感覺。

在經過多年的努力之下,至目前為止,Google算是在機器學習的領域小有成就,且已在Gmail、Google Photos App、Inbox by Gmail App等工具中,成功運用機器學習的技術,為使用者帶來更好的使用體驗。Google認為,過去工程師習慣撰寫演算法來教機器如何思考,這樣制式化的方式未來將會被機器學習所取代,而對於消費者而言,或許很難理解機器學習背後的運作原理,但你卻可以期待更為智慧、甚至讓你覺得聰明的(行動)裝置即將被發明,而將對你我生活的許多層面帶來想像不到的便利性,光是這樣的願景,不就很值得期待了嗎?

沒有留言:

張貼留言