近年來,深度學習已經成爲機器學習的一大趨勢。它已成功地應用於解決視覺、語音識別和自然語言處理等領域以前無法解決的問題。有許多領域正在應用深度學習,並已顯示出其有用性。
Caffe(快速特徵嵌入的卷積結構)是在伯克利視覺和學習中心(BVLC)開發的一個深度學習框架。Caffe項目是楊慶佳在加州大學伯克利分校攻讀博士學位期間創建的。Caffe提供了一種簡單的方法來進行深入學習的實驗。它是用C++編寫的,提供了 python 和 Matlab < /b>的綁定。
它支持多種不同類型的深度學習體系結構,如卷積神經網絡、長短期記憶和完全連接。它支持GPU,因此非常適合於涉及深層神經網絡的生產環境。它還支持基於CPU的內核庫,如NVIDIA、CUDA深層神經網絡庫(cuDNN)和英特爾數學內核庫(英特爾MKL)。
2017年4月,美國社交網絡服務公司Facebook宣布了Caffe2,現在包括RNN(遞歸神經網絡),2018年3月,Caffe2併入Pythorch。Caffe2的創造者和社區成員已經創建了解決各種問題的模型。這些模型作爲預先訓練的模型提供給公衆。Caffe2幫助創建者使用這些模型並創建自己的網絡來對數據集進行預測。
在討論Caffe2的細節之前,讓我們先了解一下機器學習和深度學習之間的區別。這對於理解如何在Caffe2中創建和使用模型是必要的。
Machine Learning v/s Deep Learning
在任何一種機器學習算法中,無論是傳統算法還是深度學習算法,數據集中特徵的選擇對於獲得期望的預測精度都起著極其重要的作用。在傳統的機器學習技術中,特徵選擇主要是通過人的觀察、判斷和深入的領域知識來完成的。有時,您可以從一些經過測試的算法中尋求幫助以進行特徵選擇。
傳統的機器學習流程如下圖所示;
在深度學習中,特徵選擇是自動的,是深度學習算法本身的一部分。如下圖所示;
在深度學習算法中,特徵工程是自動完成的。一般來說,特徵工程是耗時的,並且需要在領域中很好的專業知識。爲了實現特徵的自動提取,深度學習算法通常需要大量的數據,因此如果你只有成千上萬的數據點,深度學習技術可能無法給你帶來令人滿意的結果。
在數據量較大的情況下,與傳統的ML算法相比,深度學習算法具有較少或不需要特徵工程的優點。