Translate

2015年11月12日 星期四

Google揭秘機器學習7大關鍵

在Google擔任人工智能、計算神經科學、及可量化機器學習研究員的Greg Corrado 博士。(圖/黃慧雯攝)
Google於10日在日本東京舉辦亞太區媒體活動,以「The magic in the machine」為題,舉辦相關的主題演講以及參訪活動。對於網友來說,或許覺得這個主題離你很遠,然而其實我們日常生活中就已經享受機器學習(Machine Learning)的相關服務,且很可能你早已愛不釋手!關於機器學習的領域,讓我們來一起來瞭解幾個關鍵問題,讓你瞬間搞懂,吸收Google工程師一甲子的功力!

1、 機器學習是什麼?
一個改變現有軟體工程師工作內容的方法。相較於過去工程師透過撰寫有實際演算法的程式碼,讓程式(program)透過實際的條件來執行(重複性高的任務),機器學習則是讓程式透過大量的實際例子來學習。

以下透過讓機器學習預測「學生讀書時間與學業成績間的關係」這件例子來解釋機器學習的過程。試想,學生閱讀(x)的時間與學業成績(y)之間的關係,若以不同的xy參數來代表,透過一些學生的資料,我們可以在數學的象限繪出一條能以代數方程式呈現的直線,來代表當中的關係。而對於機器學習來說,這條直線與y軸之間的角度(W)以及與原點間的距離(b),可以讓我們得出這條直線的代數方程式為y=Wx+b。而機器學習則是透過大量的例子(學生成績與學習時間的資料),作為Learner,讓擁有機器學習能力的程式,透過微調W與b的數值,讓所繪出預測直線,能更為準確地預測下一個學生的資料。

讓機器學習預測「學生讀書時間與學業成績間的關係」的例子說明。(圖/Google)
2、機器學習的內容是什麼?
相對於過往的Program,可以透過套用工程師寫下的演算法快速得出一個結果,然而所能處理的任務,卻對於人們日常生活便利性的提升,帶來不大的效果;機器學習透過非常大量例子學習的歷程,會漸進式變得更為準確,較能滿足「提升人們日常生活品質」的這個目標,例如讓你不用減少電子信箱中看到垃圾郵件;當你習慣於給予Google「某些電子郵件是垃圾郵件,而某些被判斷為垃圾郵件的信件,並非屬於此類」的回饋時,其實背後的機器學習程式將會慢慢學習到對於你來說,哪些信件應該歸為垃圾郵件,哪些不是,隨著時間前進,結果會越來越準確。

3、機器學習能得到什麼結果?
透過機器學習,你能得到一個較為一般性的結果,例如「包含某些特定內容的信,對於大部份的使用者來說,是垃圾郵件」,然而這不一定適用在「所有的」使用者身上。

4、過往有時會聽見的「深度學習」又是什麼?
深度學習(deep learning)屬於機器學習領域,而且是一個具備巨大影響力的工具。簡而言之,深度學習模擬了人們大腦神經元的運作模式,透過運用多層次的機器學習功能(程式),可以讓機器學習像人類一樣判斷一些事情,例如「辨識圖片中的主體是貓」。

深度學習當中的每一層程式,類似大腦的神經元,執行的任務很小,但是所產生的結果將被下一層機器學習程式作為輸入(input),再接著進行下一階段的任務,而透過多層次的學習歷程,也就是說一個具備多個機器學習功能的深度學習程式,就可以執行「辨識圖片中的主體是貓」的任務。

透過深度學習,可以達成圖片內容辨識的任務。(圖/Google)
5、你的日常生活跟機器學習有關嗎?
當前,Google已經將機器學習的成果運用在Inbox by Gmail App(最新發佈的Smart Reply功能)、Gmail Spam判斷、Google Photos分類與搜尋、Google翻譯的語音辨識等功能中。也就是說,在你可能沒有察覺的情況下,你已經接受了不少來自Google於機器學習領域所獲結果的幫助囉!

Google旗下多款工具都已運用在機器學習相關技術。(圖/Google)
6、機器學習為什麼最近好像變顯學,大公司都在談?
根據在Google擔任人工智能、計算神經科學、及可量化機器學習研究員的Greg Corrado 博士所言,因為電腦當前的速度已經夠快,可以處理大量的資訊,因此需要仰賴大量例子來學習的機器學習,能產生可見且具影響力的成果,讓人們的日常生活更為便利。

7、機器學習是一種魔術嗎?
透過了解以上內容,相信你可以輕鬆回答這個問題,答案就是「No」,機器學習是一種運用於許多終端產品中的工具。

作為一個讀者(消費者),你或許不需要太過充分的理解以上的內容,不過你卻已能體驗到Google投注在機器學習領域的成果,並且天天享受它。如果你期待你手中的手機、電腦還能更聰明,還能為你想到更多,未來你能持續關注這方面的議題,或者甚至成為一個程式開發者的方向來努力。因為日前Google甫推出了TensorFlow,內容是機器學習原始碼,藉由開放TensorFlow,Google期待將加速機器學習領域發展,所以你也能成為替人類生活帶來更多便利性的當中一員!

Google釋出機器學習相關的原始碼,並採開放的做法,名為TensorFlow,企圖加速此領域的發展,或者更進一步站穩領先者的地位。(圖/Google)

沒有留言:

張貼留言