破解人類識(shí)別文字之謎,對(duì)圖像中的字母進(jìn)行無(wú)監(jiān)督學(xué)習(xí)
Alberto Testolin | 2017-08-28 14:26
【數(shù)據(jù)猿導(dǎo)讀】 Nature 子刊 Nature Human Behavior 上最新發(fā)表了一篇關(guān)于人類行為的研究,通過(guò)對(duì)自然圖像中的字母進(jìn)行無(wú)監(jiān)督學(xué)習(xí),探討了人類是如何獲得文字識(shí)別能力的。研究人員提出了一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)的大規(guī)模字母識(shí)別計(jì)算模型,通過(guò)將概率生成模型與視覺(jué)輸入擬合,以完全無(wú)監(jiān)督的方式開(kāi)發(fā)...

Nature 子刊 Nature Human Behavior 上最新發(fā)表了一篇關(guān)于人類行為的研究,通過(guò)對(duì)自然圖像中的字母進(jìn)行無(wú)監(jiān)督學(xué)習(xí),探討了人類是如何獲得文字識(shí)別能力的。研究人員提出了一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)的大規(guī)模字母識(shí)別計(jì)算模型,通過(guò)將概率生成模型與視覺(jué)輸入擬合,以完全無(wú)監(jiān)督的方式開(kāi)發(fā)了復(fù)雜的內(nèi)部表征的層次結(jié)構(gòu)。
書寫符號(hào)的使用是人類文化發(fā)展的重大成就。然而,抽象的字母表征是如何在視覺(jué)中進(jìn)行學(xué)習(xí)的,這仍然是未解決的問(wèn)題。發(fā)表在 Nature.com 上的一篇題為 Letter perception emerges from unsupervised deep learning and recycling of natural image features 的研究報(bào)告中,研究人員提出了一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)的大規(guī)模的字母識(shí)別計(jì)算模型,通過(guò)將概率生成模型與視覺(jué)輸入擬合,以完全無(wú)監(jiān)督的方式開(kāi)發(fā)了更為復(fù)雜的內(nèi)部表征的層次結(jié)構(gòu)。
有這樣一個(gè)假設(shè),學(xué)習(xí)書寫符號(hào)部分地重新使用了用于對(duì)象識(shí)別的預(yù)先存在的神經(jīng)元回路,模型的早期處理階段利用了從自然圖像中學(xué)習(xí)的一般領(lǐng)域(domain-general)的視覺(jué)特征,而特定領(lǐng)域(domain-specific)的特征則出現(xiàn)在曝光于印刷字母前的上游神經(jīng)元中。
研究論證,即使對(duì)于噪聲降級(jí)(noise-degraded)的圖像,這些高級(jí)別表征可以很容易地映射到字母識(shí)別,從而產(chǎn)生和人類觀察者類似的對(duì)于字母認(rèn)知的廣泛實(shí)證結(jié)果的準(zhǔn)確模擬。研究者的模型顯示出,通過(guò)重用自然的視覺(jué)原語(yǔ)(primitives),學(xué)習(xí)書寫符號(hào)只需要有限的、特定領(lǐng)域的調(diào)整,這支持了字母形狀被文化選擇以匹配自然環(huán)境的統(tǒng)計(jì)結(jié)構(gòu)的假設(shè)。
圖 1a 刻畫了研究者提出的模型的整體架構(gòu)。網(wǎng)絡(luò)底層接收了作為圖像像素 灰度級(jí)別激活編碼的感知信號(hào)。出現(xiàn)在視網(wǎng)膜和丘腦中的低級(jí)別視覺(jué)處理被一個(gè)啟發(fā)自生物學(xué)的 whitening 算法所模擬,捕捉到了圖像中的局部空間關(guān)系,成為了對(duì)比歸一化(contrast normalization)的一個(gè)步驟。
圖1 是深度學(xué)習(xí)架構(gòu)和自然圖像及印刷字母數(shù)據(jù)樣本。
a,深度學(xué)習(xí)架構(gòu)。每個(gè)框代表了網(wǎng)絡(luò)中的一層神經(jīng)元。和 whitening 步驟相應(yīng)的有方向的箭頭引出了前饋的處理過(guò)程,而無(wú)方向的連接顯示了無(wú)監(jiān)督生成學(xué)習(xí)所利用的雙向處理過(guò)程。和線性讀數(shù)層相應(yīng)的有方向的箭頭引出了監(jiān)督學(xué)習(xí)。在字母處理過(guò)程中涉及到的相應(yīng)大腦網(wǎng)絡(luò)顯示在右側(cè)(LGN, 背外側(cè)膝狀體核; V1, 首要視覺(jué)皮層; V2, 二級(jí)視覺(jué)皮層; V4, 紋狀體外視覺(jué)皮層;OTS, 顳枕溝);
b,包含多個(gè)小 patch (40 × 40 pixels)的自然圖像,顯示在右側(cè);c,研究者的數(shù)據(jù)集中印刷字母的樣本,使用多種字體、風(fēng)格、大小和位置關(guān)系創(chuàng)造而成。
研究人員將編碼在第一個(gè)內(nèi)部層(隱式)神經(jīng)元的潛在特征集稱為H1, H1 模仿了出現(xiàn)在早期大腦皮層視覺(jué)(corticalvision ,在 V1 和 V2 中)的處理類型。
圖2 是新出現(xiàn)的神經(jīng)元感受野(receptive fields)、表征選擇和模型中字母識(shí)別準(zhǔn)確度
a,在 H1 層中神經(jīng)元樣本的感受野,灰度體現(xiàn)其連接強(qiáng)度(黑色:強(qiáng),inhibitory connection;白色:強(qiáng),excitatory connection);
b,H2 層中隱式神經(jīng)元樣本的感受野;
c 和 d,H1 層(c)和H2層(d)中對(duì)于不同刺激的平均反饋(activation norm);
e, 作為噪聲級(jí)別函數(shù)(即, 高斯噪聲的標(biāo)準(zhǔn)偏差)的不同表征層讀數(shù)的準(zhǔn)確度;f,無(wú)噪聲刺激樣本,及含噪聲的對(duì)應(yīng)版本,性能表現(xiàn)約為前者的 50%。
a,模型混淆矩陣和各種經(jīng)驗(yàn)混淆矩陣之間的Pearson 相關(guān)性(均P <0.001)。注意,所有經(jīng)驗(yàn)矩陣之間的平均互相關(guān)為0.56;b,通過(guò) H2 表征層次聚類得出的樹(shù)狀圖,表明在網(wǎng)絡(luò)的內(nèi)部表征中保留了字母之間的視覺(jué)相似性。連接柱的高度表示歐氏距離(較小的條表示更大的相似度);
c,每個(gè)字體的平均perimetric 復(fù)雜度與noise-degraded 刺激的相應(yīng)平均字母識(shí)別精度之間的負(fù)相關(guān);
d,根據(jù)平均字母混淆排列的所有字體列表,從最小混亂(上)到最大混亂(底部)。
a,b,疊加在高斯噪聲(均方根對(duì)比度= 0.2)和背景(亮度= 0.2)上的低通(a)和高通(b)濾波字母的樣本;
c,根據(jù)濾波器類型的H2讀數(shù)敏感度對(duì)比函數(shù),每個(gè)字母的頻率范圍從 0.8 到 6.6(兩個(gè)軸均為對(duì)數(shù))。注意,與對(duì)應(yīng)于低通和高通噪聲的曲線相比,對(duì)應(yīng)于低通濾波和高通濾波的曲線相反,因?yàn)檠芯空咧苯訉?duì)輸入信號(hào)而不是調(diào)制噪聲進(jìn)行濾波。
來(lái)源:36大數(shù)據(jù)
刷新相關(guān)文章
我要評(píng)論
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無(wú)界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過(guò)的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車
-
4數(shù)據(jù)智能 無(wú)限未來(lái)—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
10#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新