什么是卷積神經(jīng)網(wǎng)絡(luò)(CNN)?定義、工作原理和主要應用 – AI百科知識
什么是卷積神經(jīng)網(wǎng)絡(luò)?
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一類主要用于計算機視覺領(lǐng)域的深度學習算法,它們在各個領(lǐng)域都有應用,包括圖像和視頻識別、自然語言處理,甚至是玩游戲。CNN已經(jīng)徹底改變了計算機視覺領(lǐng)域,在物體檢測、圖像分割和面部識別等任務中提供最先進的性能。在這篇文章中,我們將簡單介紹CNN的內(nèi)部工作原理、其架構(gòu)以及在現(xiàn)實世界中的應用。

卷積神經(jīng)網(wǎng)絡(luò)的原理
要理解CNN,必須熟悉神經(jīng)網(wǎng)絡(luò)的基本概念。神經(jīng)網(wǎng)絡(luò)是一個受人腦結(jié)構(gòu)和功能啟發(fā)的計算模型,它由相互連接的人工神經(jīng)元組成。這些神經(jīng)元被組織成層,每個神經(jīng)元接收來自前幾層的輸入,并將輸出發(fā)送到后續(xù)層。
CNN是一種專門的神經(jīng)網(wǎng)絡(luò)類型,專注于處理具有網(wǎng)格狀結(jié)構(gòu)的數(shù)據(jù),如圖像。CNN的主要構(gòu)成是卷積層,其目的是自動和自適應地從輸入數(shù)據(jù)中學習空間層次的特征。
卷積層
卷積層(Convolutional Layers)是CNN的核心部分。它執(zhí)行卷積運算,這是一種數(shù)學運算,將兩個函數(shù)作為輸入并產(chǎn)生第三個函數(shù)作為輸出。在CNN的背景下,輸入函數(shù)通常是一個圖像和一個過濾器(也被稱為內(nèi)核)。卷積操作用于分析輸入圖像中的局部模式,方法是在圖像上滑動濾波器,計算濾波器和它所覆蓋的圖像區(qū)域之間的點積。
這個過程產(chǎn)生了一個特征圖,它是輸入圖像的一個表示,突出了過濾器檢測到的特定特征存在的區(qū)域。通過在卷積層中使用多個過濾器,CNN可以學會識別輸入圖像中的不同特征。
典型的CNN結(jié)構(gòu) By Aphex34 – Own work, CC BY-SA 4.0