大數(shù)據(jù)的崛起對機器學習意義非凡

大數(shù)據(jù)的核心在于數(shù)據(jù)挖掘,機器學習便是數(shù)據(jù)挖掘時最常用的方法之一。因此,機器學習技術不斷的完善,原本模仿人類大腦的三點先天不足已經(jīng)逐漸不再重要。

首先,機器學習處理大量數(shù)據(jù)時所采取的分布式處理技術已經(jīng)成熟,也就是說在處理大量的任務時,并非集中處理,而是將任務分塊,采取多個組件同時處理運算,這樣就大幅提升了計算效率,計算能力遠遠超過人類的大腦;其次,我們在機器學習時會給予其大量的樣本,并設置相應的處罰函數(shù),然后通過訓練逐步減少處罰函數(shù)出現(xiàn)的概率,提高的機器的智能水平;

機器學習不再僅僅是一種數(shù)據(jù)挖掘的算法

最后,機器學習的方法也更加成熟,現(xiàn)在一般分為三種:監(jiān)督學習,半監(jiān)督學習和無監(jiān)督學習。監(jiān)督學習是指利用一組已知標注類別的樣本調(diào)整分類器的參數(shù),使其達到所要求性能的過程。簡單來說就是給機器一堆有標記的數(shù)據(jù),然后讓機器學習后,推測得出新的未知的信息。這其中的代表方法就有神經(jīng)網(wǎng)絡、SVM、Nave Bayes、KNN和決策樹等,目前與韓國棋手李世石挑戰(zhàn)的谷歌AlphaGo采用的便是神經(jīng)網(wǎng)絡的學習方法。

半監(jiān)督學習是指介于監(jiān)督學習和無監(jiān)督學習之間,利用少量的標注樣本和大量的未標注樣本進行訓練,以得出新的位置信息的辦法。這種方法更多的像是兩種方法的結合,也是現(xiàn)在正在興起的一種方法。

無監(jiān)督學習則指設計分類器時,不給樣本參數(shù)任何標簽,讓機器自行分析處理。目標便是讓機器學會自主學習。曾經(jīng)有人設計過一項電腦程序,讓其利用無監(jiān)督學習的方法玩一款游戲,在進行了多次游戲以后,這項程序的游戲水平不僅超過了使用監(jiān)督學習方法學習的機器,比之人類最好的玩家也要出色許多。

逐漸脫離監(jiān)督進行學習,是誰的愿望?

但是目前,由于無監(jiān)督學習還處于起步狀態(tài),因此半監(jiān)督學習和監(jiān)督學習的改進版是現(xiàn)在人工智能的主流方法。無監(jiān)督學習既然已經(jīng)開始,這種更為優(yōu)秀也更智能的方法必然會成為未來發(fā)展的主流,機器學習的自主性提升后,似乎已經(jīng)比人類更勝一籌。

分享到

zhangnn

相關推薦