魯班大師一秒8千張海報(bào)
阿里科技 | 2017-11-10 11:11
【數(shù)據(jù)猿導(dǎo)讀】 AI 改變了圍棋,現(xiàn)在也在改變海報(bào)設(shè)計(jì)。這是一個(gè)名為 " 魯班 " 的 AI 設(shè)計(jì)師,它將擔(dān)綱今年雙 11 的 banner 海報(bào)設(shè)計(jì),數(shù)量高達(dá) 4 億張

在過去,每年雙11,設(shè)計(jì)師們都會開啟狂加班模式:做海報(bào)、改文字、換商品、調(diào)設(shè)計(jì)、換 banner,每個(gè)設(shè)計(jì)師對接幾個(gè)運(yùn)營人員,富士康流水線一樣的重復(fù)性工作。一年雙 11 下來,完成上億張海報(bào)。
然而,這一切正在成為過去。
AI 改變了圍棋,現(xiàn)在也在改變海報(bào)設(shè)計(jì)。這是一個(gè)名為 " 魯班 " 的 AI 設(shè)計(jì)師,它將擔(dān)綱今年雙 11 的 banner 海報(bào)設(shè)計(jì),數(shù)量高達(dá) 4 億張。
但考慮到魯班平均 1 秒鐘就能完成 8000 張海報(bào)設(shè)計(jì),一天可以制作 4000 萬張,4 億只能算一個(gè)小小小小目標(biāo)。
這個(gè)海報(bào)設(shè)計(jì) AI" 魯班 ",誕生也與雙 11 有關(guān)。
每年雙 11,都是阿里設(shè)計(jì)師的大考:海量的設(shè)計(jì)需求,需要保證所有人都統(tǒng)一規(guī)范,遇到緊急設(shè)計(jì)需求,還要快速出稿,對每一個(gè)設(shè)計(jì)師都是腦力、體力雙重考驗(yàn)。
△ 千人千面需求的 banner 設(shè)計(jì)
于是,2015 年雙 11 后,阿里內(nèi)部開始萌生想法,當(dāng)年阿里正式在商品推薦上實(shí)現(xiàn) " 千人千面 ",所以希望強(qiáng)營銷導(dǎo)向的廣告資源位的設(shè)計(jì)也能實(shí)現(xiàn) " 千人千面 "。
因此 " 魯班 " 項(xiàng)目正式成立,并不斷發(fā)展至現(xiàn)今的 " 阿里智能設(shè)計(jì)實(shí)驗(yàn)室 ":讓魯班學(xué)習(xí)人類設(shè)計(jì)師的成果和經(jīng)驗(yàn),不斷進(jìn)化,到今年雙 11,魯班的水平已經(jīng)達(dá)到了阿里內(nèi)部 P6 水準(zhǔn)。
魯班的學(xué)習(xí)進(jìn)化,主要有三大技術(shù)原理: 風(fēng)格學(xué)習(xí)(規(guī)劃 + 元素)、行動器,以及評估網(wǎng)絡(luò)。
首先是風(fēng)格學(xué)習(xí)模塊。
△ 魯班風(fēng)格學(xué)習(xí)
魯班先將大量設(shè)計(jì)素材的設(shè)計(jì)數(shù)據(jù)進(jìn)行結(jié)構(gòu)化標(biāo)注,最后經(jīng)過一系列的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),輸出空間 + 視覺的設(shè)計(jì)框架。
框架設(shè)計(jì)中,首先通過人工標(biāo)注的方式,讓機(jī)器理解該幅設(shè)計(jì)有哪些元素組成,比如它的商品主體,花的背景,蒙版。往上一層,還需要通過設(shè)計(jì)的經(jīng)驗(yàn)知識,定義一些設(shè)計(jì)的手法和風(fēng)格。手法指的是這些元素為什么可以這么構(gòu)成。最上面這一層是風(fēng)格,當(dāng)這些元素構(gòu)成之后,它從美學(xué)或者視覺角度看是一個(gè)什么感受,讓機(jī)器知道它是用什么組成。
下一步是準(zhǔn)備設(shè)計(jì)的原始文件,比如一系列花朵和設(shè)計(jì)方法,輸入到深度學(xué)習(xí)網(wǎng)絡(luò)中。該網(wǎng)絡(luò)具備一定記憶功能,可以記住設(shè)計(jì)步驟中復(fù)雜的過程。
經(jīng)過這層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)之后,會得到一個(gè)設(shè)計(jì)框架。從技術(shù)上理解,它是一堆空間特征和視覺特征構(gòu)成的模型。從設(shè)計(jì)師的視角來看,它相當(dāng)于設(shè)計(jì)師腦里在做一組設(shè)計(jì)之前那個(gè)大概的框架印象。
在設(shè)計(jì)框架的同時(shí),元素中心也在批量輸入元素(如底圖,主產(chǎn)品圖、修飾元素等),由元素分類器進(jìn)行學(xué)習(xí),按照視覺特征和類型分類。
具體來說,魯班團(tuán)隊(duì)會提前收集一些版權(quán)圖庫,以及自己造設(shè)計(jì)元素的方式,輸入到元素分類器中。這個(gè)分類器會把這些元素分布到各個(gè)類型里,比如背景、主體、修飾,也會完成圖片庫的提取。
其次是行動器。
△ 魯班行動器元素分類
行動器的主要作用,是根據(jù)需求從風(fēng)格學(xué)習(xí)模塊中選擇設(shè)計(jì)原型,并從元素中心中選取元素,規(guī)劃出多個(gè)最優(yōu)生成路徑,完成圖片設(shè)計(jì)。
這與設(shè)計(jì)師實(shí)際工作過程非常相似,如設(shè)計(jì)師要設(shè)計(jì)一朵花,也會在軟件里會不斷去調(diào)每個(gè)位置、每個(gè)像素、每個(gè)角度。同時(shí),整個(gè)過程也是一個(gè)強(qiáng)化學(xué)習(xí)的過程,行動器會在不斷試錯(cuò)中更聰明、更智能。
此過程完成后,將輸出多個(gè)設(shè)計(jì)圖,并最終交給 " 評估網(wǎng)絡(luò) " 對輸出產(chǎn)品進(jìn)行評分。
最后是評估網(wǎng)絡(luò)。
△ 魯班評估網(wǎng)絡(luò)
評估網(wǎng)絡(luò)的工作原理是輸入大量的設(shè)計(jì)圖片和評分?jǐn)?shù)據(jù),經(jīng)過訓(xùn)練后,讓機(jī)器學(xué)會判斷設(shè)計(jì)的好壞。
魯班的基礎(chǔ)是來源于設(shè)計(jì)師的設(shè)計(jì)模板素材和元素素材,因此會有兩個(gè)設(shè)計(jì)師角色每天去訓(xùn)練魯班,一個(gè)負(fù)責(zé)幫助魯班完成最新的風(fēng)格學(xué)習(xí)(風(fēng)格學(xué)習(xí)),讓魯班不斷進(jìn)化,不斷掌握更好的設(shè)計(jì)技巧。
另一個(gè)的角色則是對魯班設(shè)計(jì)出來的成果進(jìn)行評估(評估網(wǎng)絡(luò)),告訴魯班什么樣的設(shè)計(jì)才是最好的。
設(shè)計(jì)師的核心職責(zé),在于把設(shè)計(jì)變成數(shù)據(jù)化。目前,魯班已經(jīng)學(xué)習(xí)了百萬級的設(shè)計(jì)稿,擁有了演變出上億級的海報(bào)設(shè)計(jì)能力。
這背后,阿里的設(shè)計(jì)師和算法工程師做了三大功課。
第一,領(lǐng)域研究。找到該領(lǐng)域?qū)<疑钊胙芯吭擃I(lǐng)域的經(jīng)驗(yàn)知識,構(gòu)建一套機(jī)器可以學(xué)習(xí)的數(shù)據(jù)模型。視覺設(shè)計(jì)專家把設(shè)計(jì)問題抽象成 " 風(fēng)格 - 手法 - 模板 - 元素 " 這樣一套數(shù)據(jù)模型,即把多年視覺設(shè)計(jì)經(jīng)驗(yàn)變成機(jī)器可學(xué)習(xí)的 " 數(shù)據(jù) "。
第二,數(shù)據(jù)鏈路。定義好數(shù)據(jù)模型后,抓取和標(biāo)注數(shù)據(jù),并對數(shù)據(jù)集進(jìn)行分類和管理。在這個(gè)過程匯總,如果處理數(shù)據(jù)給算法訓(xùn)練的更新頻次,用什么數(shù)據(jù)去驗(yàn)證模型,如何評估模型效果,離線模型與在線數(shù)據(jù)在產(chǎn)品端如何打通?這一系列的數(shù)據(jù)問題就需要一套清晰的數(shù)據(jù)鏈路設(shè)計(jì)。
第三,算法框架。算法框架由算法科學(xué)家來制定,數(shù)據(jù)和算法的關(guān)系就像汽油和發(fā)動機(jī),兩者密不可分。產(chǎn)品設(shè)計(jì)師需要與算法討論,把業(yè)務(wù)場景和數(shù)據(jù)問題輸入給算法。
這也是阿里內(nèi)部讓產(chǎn)品設(shè)計(jì)師學(xué)習(xí)機(jī)器學(xué)習(xí)的原因,因?yàn)楦愣惴蚣芎图夹g(shù)原理,才能更好理解工作原理。
但三方面功課背后,也不是沒有挑戰(zhàn)。整個(gè)魯班打造過程中,遭遇了三方面技術(shù)挑戰(zhàn)。
首先是缺少標(biāo)注數(shù)據(jù)。今天所有的人工智能都基于大規(guī)模結(jié)構(gòu)化標(biāo)注數(shù)據(jù),設(shè)計(jì)這件事情連數(shù)據(jù)都沒有完成在線化,更別說標(biāo)準(zhǔn)化、結(jié)構(gòu)化的數(shù)據(jù)。
其次是設(shè)計(jì)的不確定性。設(shè)計(jì)是個(gè)很不確定的東西,設(shè)計(jì)需求把握和結(jié)果評估都存在人類主觀意識。比如你無法給機(jī)器輸入 " 高端大氣的海報(bào) " 這樣的指令。
最后是無先例可循。整個(gè)行業(yè)中沒有一些現(xiàn)成的技術(shù)或者框架可以參考,這和 AlphaGo 帶來的福利不同。當(dāng)時(shí) AlphaGo 團(tuán)隊(duì)公布論文后,全世界圍棋 AI 都照此提升了戰(zhàn)力。但對于魯班來說,并無先前經(jīng)驗(yàn)可以參考,一切全憑自己摸索。不過也并非完全沒有收獲,在探索中的一年,阿里魯班團(tuán)隊(duì)對 AI 產(chǎn)品有了更為清晰的定義。
他們內(nèi)部認(rèn)為,魯班做的 AI 是可控的視覺生成??煽?,指的是根據(jù)商業(yè)的需求、業(yè)務(wù)的需求,智能地進(jìn)行控制;視覺生成,則表明魯班解決的是視覺從無到有的問題。
在 2016 年雙 11,魯班首次登場。它最終制作了 1.7 億張廣告 banner,點(diǎn)擊率提升 100%。
與人類對比的話,假設(shè)每張圖,人類設(shè)計(jì)師需要耗時(shí) 20 分鐘,滿打滿算也需要 100 個(gè)設(shè)計(jì)師連續(xù)做 300 年。
而今年,魯班也被進(jìn)行了進(jìn)一步迭代。設(shè)計(jì)水平顯著提升,最新的數(shù)據(jù)情況是:
魯班已經(jīng)學(xué)習(xí)了百萬級的設(shè)計(jì)稿,擁有演變出上億級的海報(bào)設(shè)計(jì)能力。 今年雙 11,魯班已經(jīng)可以實(shí)現(xiàn)一天制作 4000 萬張海報(bào),平均每秒可實(shí)現(xiàn)設(shè)計(jì) 8000 張海報(bào),并且每張海報(bào)會根據(jù)商品圖像特征專門設(shè)計(jì),換句話說說,魯班設(shè)計(jì)出的海報(bào),沒有一張會完全一樣的。
按照當(dāng)前阿里內(nèi)部對技術(shù)崗位的評判體系,海報(bào)設(shè)計(jì) AI 魯班,已經(jīng)達(dá)到了 P6 水準(zhǔn),后續(xù)進(jìn)階也只會越來越快。
那設(shè)計(jì)師會就此被 AI 替代嗎?
當(dāng)然不會!
" 魯班今年花了半個(gè)月時(shí)間學(xué)會雙 11 設(shè)計(jì)風(fēng)格,目前已經(jīng)開始產(chǎn)出一部分人類沒教過它的設(shè)計(jì)了。但是最具創(chuàng)新意義的創(chuàng)造類設(shè)計(jì),目前只能通過 人機(jī)協(xié)同 的方式完成。" 魯班負(fù)責(zé)人樂剩介紹說。
機(jī)器智能只是社會新生產(chǎn)力的一部分。機(jī)器人與人合作,既提升了效率和質(zhì)量,又讓天貓雙11超級工程變得如此“輕松”。
來源:阿里科技
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯(cuò)過的資訊
-
1【金猿案例展】中國銀聯(lián):以內(nèi)外聯(lián)動的數(shù)
-
2全棧云原生產(chǎn)品戰(zhàn)略升級,時(shí)速云領(lǐng)跑云原
-
3新趨勢·新未來 | 2019第六屆中國嬰幼
-
4【金猿產(chǎn)品展】中原銀行智能化BI:一站式
-
5【金猿產(chǎn)品展】易觀方舟:智能用戶數(shù)據(jù)中
-
6【金猿人物展】張涵誠: 2020年大數(shù)據(jù)產(chǎn)
-
7小飯桌2019全球青年創(chuàng)業(yè)者大會圓滿舉辦,
-
8繁華之下有隱憂,零售企業(yè)如何走出增長困
-
9【金猿產(chǎn)品展】羽扇決策引擎平臺:運(yùn)籌帷
-
10【金猿案例展】國網(wǎng)上海市電力:智能配用