藍(lán)燈數(shù)據(jù)董事長(zhǎng)周強(qiáng):“大數(shù)據(jù)”結(jié)合“小數(shù)據(jù)”才能有效破案
原創(chuàng) 周強(qiáng) | 2017-12-10 08:05
【數(shù)據(jù)猿導(dǎo)讀】 12月1日下午,由上海大數(shù)據(jù)聯(lián)盟、數(shù)據(jù)猿主辦的第20期魔方大數(shù)據(jù)在上海寶華萬(wàn)豪酒店成功舉辦。本期魔方大數(shù)據(jù)以“政務(wù)大數(shù)據(jù)”為主題,邀請(qǐng)了技術(shù)方和產(chǎn)業(yè)方大咖共聚一堂,共同探討了政務(wù)大數(shù)據(jù)落地實(shí)施的有效路徑。本文是數(shù)據(jù)猿整理“藍(lán)燈數(shù)據(jù)董事長(zhǎng)周強(qiáng)”的發(fā)言實(shí)錄:

12月1日下午,由上海大數(shù)據(jù)聯(lián)盟、數(shù)據(jù)猿主辦的第20期魔方大數(shù)據(jù)在上海寶華萬(wàn)豪酒店成功舉辦。本期魔方大數(shù)據(jù)以“政務(wù)大數(shù)據(jù)”為主題,邀請(qǐng)了技術(shù)方和產(chǎn)業(yè)方大咖共聚一堂,共同探討了政務(wù)大數(shù)據(jù)落地實(shí)施的有效路徑。
以下是數(shù)據(jù)猿整理“藍(lán)燈數(shù)據(jù)董事長(zhǎng)周強(qiáng)”的發(fā)言實(shí)錄:
大家下午好,非常高興有這樣的機(jī)會(huì)和大家分享我們公司在大數(shù)據(jù)方面的經(jīng)驗(yàn),我們公司叫藍(lán)燈數(shù)據(jù)科技有限公司,已于2015年在新三板掛牌上市。
我們將自己定義為大數(shù)據(jù)領(lǐng)域中人的行為分析的專家,可以從三方面理解這個(gè)定義:
一、我們?cè)诖髷?shù)據(jù)領(lǐng)域做什么?我們做的是大數(shù)據(jù)領(lǐng)域微觀對(duì)象的關(guān)聯(lián)關(guān)系。
二,我們做什么類型?我們做關(guān)聯(lián)關(guān)系。
三,我們做的是大數(shù)據(jù)和小數(shù)據(jù)的混合體。
我今天發(fā)言的主題叫《AI時(shí)代的警務(wù)大數(shù)據(jù)》。
我喜歡稱“大數(shù)據(jù)”為海量數(shù)據(jù),因?yàn)楹A繑?shù)據(jù)只是數(shù)據(jù)的結(jié)構(gòu)和種類,大數(shù)據(jù)則需要對(duì)圖像數(shù)據(jù)、文本數(shù)據(jù)、音頻數(shù)據(jù)結(jié)構(gòu)化后進(jìn)行對(duì)比。
目前我們對(duì)大數(shù)據(jù)我們產(chǎn)生一個(gè)誤區(qū)即大數(shù)據(jù)越大越好,其實(shí)不然,80%到90%的數(shù)據(jù)未必能夠產(chǎn)生真正有效的價(jià)值,在海量數(shù)據(jù)中真正有價(jià)值的數(shù)據(jù)可能只占到20%到30%。
我們?cè)诠舶踩I(lǐng)域里面,更關(guān)注大數(shù)據(jù)和小數(shù)據(jù)的結(jié)合,兩者之間有什么關(guān)系呢?大數(shù)據(jù)的核心是預(yù)測(cè),例如投機(jī)學(xué)算法、人工智能算法。小數(shù)據(jù)的主要特點(diǎn)是微觀、精準(zhǔn)。
我們這個(gè)行業(yè)是總結(jié)數(shù)據(jù),然后發(fā)掘潛在關(guān)系的。犯罪嫌疑人總是想盡一切辦法隱藏、掩蓋犯罪行為,我們做的事情就是通過(guò)數(shù)據(jù)的碰撞、梳理、比對(duì)、算法分析以后發(fā)現(xiàn)真相、發(fā)現(xiàn)關(guān)系。
在分析一個(gè)具體案件的時(shí)候,我們的分析手段有兩種。第一,從海量數(shù)據(jù)入手。比如高速公路上的卡口信息、上網(wǎng)信息、海量的基站信息等。第二,結(jié)合微觀數(shù)據(jù)。微觀數(shù)據(jù)就是和一個(gè)特定對(duì)象有關(guān)的數(shù)據(jù),這些數(shù)據(jù)可能是通過(guò)執(zhí)法手段獲得的,比如微信、朋友圈、通訊錄、銀行交易信息等這些小數(shù)據(jù)。這些小數(shù)據(jù)是在海量數(shù)據(jù)中尋找的,用特定對(duì)象的信息去尋找潛在的、隱藏的同謀以及受害人。比如做反電信詐騙案的時(shí)候,就通過(guò)海量的交易信息去尋找受害對(duì)象。
警務(wù)大數(shù)據(jù)是我們做的更加專業(yè)的領(lǐng)域。我們?cè)诰瘎?wù)大數(shù)據(jù)方面的思路用傳統(tǒng)的方法叫做數(shù)據(jù)分析研判。我們有一套獨(dú)特的分析模型,分析模型來(lái)自兩方面,傳統(tǒng)算法理論和社會(huì)網(wǎng)絡(luò)關(guān)系理論,更多的是來(lái)自一些經(jīng)驗(yàn)?zāi)P?,我們叫做特征指?biāo)值模型。
以盜竊為例,盜竊其實(shí)是很專業(yè)的領(lǐng)域,分行業(yè)和種類,有些是技術(shù)開鎖,有些是暴力盜竊,有些人白天爬高樓盜竊,有些人白天觀察,晚上盜竊。在做盜竊模型時(shí),種類是不一樣的,每一種盜竊類型或者犯罪類型都有自己的特征模型。
春節(jié)前后技術(shù)開鎖型的盜竊范圍行為比較多,這種行為有怎樣的特征呢?
第一,有地域特色。專門做技術(shù)開鎖,用萬(wàn)能鑰匙或者特別的鑰匙開門的團(tuán)伙,一般都來(lái)自某一個(gè)地區(qū)。
第二,他們有住宿習(xí)慣。盜竊前沒(méi)錢,他們可能住一些小旅館,50塊、80塊一天,盜竊成功后就可能住五星級(jí)酒店。還有入駐時(shí)間,正常人中午或者下午入住,第二天早晨退房。有盜竊行為的人可能是半夜或者是凌晨入住,這種情況我們就叫反常入住、反時(shí)差入駐。我們通過(guò)這樣的分析建立特征模型,通過(guò)我們自己獨(dú)特的分析體系來(lái)判斷這段時(shí)間這個(gè)區(qū)域有沒(méi)有出現(xiàn)這種行為的人,預(yù)測(cè)是不是會(huì)有物品盜竊。
我們是對(duì)數(shù)據(jù)進(jìn)行收集,我們本身不產(chǎn)生數(shù)據(jù)。對(duì)數(shù)據(jù)進(jìn)行分析主要取決于我們的模型,這種模型建立好之后可以產(chǎn)生預(yù)警作用或者特定人員核查的作用。
雖然有同類型的公司或者平臺(tái)也在做,但我們的Itap產(chǎn)品是目前國(guó)內(nèi)實(shí)戰(zhàn)能力最強(qiáng)的。我們?cè)谶@個(gè)領(lǐng)域做案件分析服務(wù)已經(jīng)有15年了,我們的團(tuán)隊(duì)有15到20年的經(jīng)驗(yàn),收集了全國(guó)各地的犯罪模型,將其搭在上面。
每個(gè)省都有每個(gè)省的數(shù)據(jù),公安機(jī)關(guān)的內(nèi)部布置我們叫做平臺(tái)節(jié)點(diǎn),這些節(jié)點(diǎn)和節(jié)點(diǎn)之間我們叫做情報(bào)分享。情報(bào)分享不是去調(diào)用這些數(shù)據(jù)而是通過(guò)數(shù)據(jù)上面的模型去運(yùn)算這些數(shù)據(jù),然后反饋結(jié)果。我們?cè)谛陆鲆恍┓纯址治龅臅r(shí)候,就把一些恐怖分子或者疆獨(dú)分子的信息在平臺(tái)上進(jìn)行分享,提供及時(shí)的情報(bào)分析。
數(shù)據(jù)分析不可避免會(huì)遇到可視化,我們的可視化區(qū)別于傳統(tǒng)的BI做圖形、報(bào)表、柱狀圖、熱點(diǎn)圖等。我們的可視化更專注于關(guān)系圖,我們把熱點(diǎn)圖做宏觀層面的可視化還有各種方式的微觀層面的可視化展現(xiàn)?,F(xiàn)在市場(chǎng)上有很多這樣的開源軟件,更多的是工具型的,我們通過(guò)線條,數(shù)據(jù)和數(shù)據(jù)之間的關(guān)系進(jìn)行關(guān)聯(lián)轉(zhuǎn)線。我剛剛講了一個(gè)關(guān)鍵詞叫微觀對(duì)象,在我們的系統(tǒng)平臺(tái)上微觀對(duì)象是一個(gè)人,或者是任意一樣?xùn)|西,一個(gè)手機(jī)號(hào)、銀行卡、一部車、一個(gè)車牌號(hào)、一個(gè)銀行賬戶等,我們建立的不是人和人之間的關(guān)系,我們建立的是所有微觀關(guān)系,可能是人和車的關(guān)系、車和手機(jī)的關(guān)系、手機(jī)和卡的關(guān)系、手機(jī)號(hào)碼和微信號(hào)的關(guān)系,通過(guò)建立層層關(guān)系去發(fā)掘內(nèi)部隱含的秘密或者事情的真相。
我們盡量做的讓人看起來(lái)好看、直觀,但從我們的角度來(lái)講,我們?cè)谶@個(gè)上面做了一些關(guān)系鏈接后,每一條路徑的計(jì)算要能夠一條線建立起來(lái),或者這條線背后要有一定的算法支撐。大家對(duì)社會(huì)關(guān)系網(wǎng)絡(luò)理論或者社會(huì)統(tǒng)計(jì)學(xué)比較熟悉的話,就會(huì)知道關(guān)系里面有幾種度量指標(biāo),那么每一項(xiàng)指標(biāo)怎么計(jì)算呢?我們算的是這些關(guān)系路徑的總合,通過(guò)路徑總和來(lái)計(jì)算出每一個(gè)對(duì)象在一個(gè)圈子里面或者在一群關(guān)系里面的位置,通過(guò)這些指標(biāo)的大小、差異,就是這幾項(xiàng)指標(biāo)值的分布確定這個(gè)人或者這個(gè)物體、這個(gè)對(duì)象在圈子的位置,我們?cè)?jīng)把這樣的算法用在傳銷團(tuán)伙的觀察。在犯罪偵破里面,有的時(shí)候辦案人員會(huì)去“養(yǎng)”這樣的案件,在“養(yǎng)”的時(shí)候我們搜集了這些信息做分析,就是觀察這個(gè)團(tuán)隊(duì)的動(dòng)態(tài)發(fā)展變化。
例如,我們通過(guò)通話次數(shù)、通話頻率、主叫次數(shù)、被叫次數(shù)等就可以分析和判斷某個(gè)人在這個(gè)團(tuán)伙或組織里面屬于什么樣的位置,預(yù)測(cè)未來(lái)這些人會(huì)怎么發(fā)展。國(guó)外將這方面的應(yīng)用用在一些體育訓(xùn)練里面,上次我在美國(guó)看到他們用在足球訓(xùn)練上。一個(gè)場(chǎng)上有11個(gè)人,每個(gè)球員身上都裝有一個(gè)傳感器,在球上也裝一個(gè)傳感器,最后把這些人傳球的次數(shù)、跑動(dòng)的頻率、跑動(dòng)的時(shí)長(zhǎng)、跑動(dòng)的位置的數(shù)據(jù)拿出來(lái)做分析,分析中鋒是不是起到了中鋒的作用,前衛(wèi)是不是起到了前衛(wèi)的作用。
我們做可視化的時(shí)候,也有一些問(wèn)題,可視化只是一個(gè)展現(xiàn)的方式,如果不結(jié)合一些關(guān)系模型的話,看到的就只是一張好看的圖。一張熱點(diǎn)圖或者一張熱度圖背后一定會(huì)有各種各樣的模型支撐。
尋找出關(guān)系以后下一步怎么做呢?傳統(tǒng)的方法是同級(jí)比較分析,我們做碰撞、比對(duì)、關(guān)聯(lián)、挖掘。數(shù)據(jù)查詢、數(shù)據(jù)挖掘、數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)碰撞,這些都在超大表上面,因?yàn)槲覀儽澈笥玫臄?shù)據(jù)庫(kù)混合了各種各樣的數(shù)據(jù)庫(kù),傳統(tǒng)的數(shù)據(jù)庫(kù)、圖形數(shù)據(jù)庫(kù)、文本數(shù)據(jù)庫(kù),數(shù)據(jù)已經(jīng)放到了各種各樣的地方。這些數(shù)據(jù)通過(guò)標(biāo)簽、索引等,進(jìn)行碰撞、對(duì)比。我們的分析模型有從人到案的也有從案到人的。從人到案,通過(guò)分析人的數(shù)據(jù)去尋找我們未能發(fā)現(xiàn)的案件,另一種是發(fā)現(xiàn)了具體的案件,找出誰(shuí)是具體的犯罪分子或者犯罪嫌疑人,這是兩種分析模型,就是兩種對(duì)比分析,我們把這樣一個(gè)模式變成人到數(shù)據(jù)、數(shù)據(jù)到案件、案件到人的一個(gè)閉環(huán)體系。
平臺(tái)的核心是模型的建立,我們將2000多個(gè)戰(zhàn)法分到各種領(lǐng)域里面建立了將近2000多種模型來(lái)預(yù)警。青海省今年1月份部署了我們的平臺(tái),半年時(shí)間用特征預(yù)警模型幫助青海省公安廳查獲了100多個(gè)犯罪分子。像曠世、云圖這些提供圖像算法、人臉識(shí)別基礎(chǔ)技術(shù)的人臉識(shí)別公司跟我們的平臺(tái)結(jié)合以后,我們把一個(gè)圖形身份化,就是IP化,把圖轉(zhuǎn)換成身份信息、手機(jī)號(hào)信息,解構(gòu)之后跟傳統(tǒng)的數(shù)據(jù)放在一起進(jìn)行比對(duì)。
信息一方面通過(guò)越來(lái)越多的數(shù)字化的手段獲取,另外也有人力情報(bào)。有一個(gè)APP,被大家開玩笑的稱為“朝陽(yáng)群眾”,我們?cè)谛陆暇€了一個(gè)類似“朝陽(yáng)群眾”的APP,有將近50萬(wàn)的使用量。我們讓社區(qū)群眾使用這些APP,通過(guò)這樣的APP掌握一些維穩(wěn)線索,叫人力情報(bào)。如果舉報(bào)一條有價(jià)值的線索,這條線索就會(huì)到后臺(tái),后臺(tái)會(huì)分析,分析了以后就會(huì)給舉報(bào)人獎(jiǎng)勵(lì),受獎(jiǎng)勵(lì)的吸引,每天在線人數(shù)有將近20萬(wàn)。
在智能應(yīng)用里面,現(xiàn)在人工智能很熱,有各種各樣的東西。人工智能也好、未來(lái)的新技術(shù)也好,我們是這些技術(shù)的積極應(yīng)用者和場(chǎng)景設(shè)計(jì)者,去找好的技術(shù),我們一起配合,用到自己的方案里面。
以上是在國(guó)家安全、公共安全領(lǐng)域里面我們所做的一些工作,謝謝大家。
九次方華東區(qū)總經(jīng)理姚樂(lè)生:大數(shù)據(jù)建設(shè)要結(jié)合地方產(chǎn)業(yè)
金電聯(lián)行征信事業(yè)部副總裁范文清:社會(huì)信用體系建設(shè)要將各種數(shù)據(jù)進(jìn)行結(jié)合
夢(mèng)創(chuàng)雙楊大數(shù)據(jù)負(fù)責(zé)人杜國(guó)寧:產(chǎn)融大數(shù)據(jù)助力“雙創(chuàng)”快速發(fā)展
市民云總經(jīng)理王兆進(jìn):手機(jī)APP中的智慧城市
機(jī)遇與挑戰(zhàn)并存 看政務(wù)大數(shù)據(jù)如何提升民生服務(wù)水平
來(lái)源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評(píng)論
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無(wú)界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過(guò)的資訊
-
1【金猿案例展】中國(guó)銀聯(lián):以內(nèi)外聯(lián)動(dòng)的數(shù)
-
2全棧云原生產(chǎn)品戰(zhàn)略升級(jí),時(shí)速云領(lǐng)跑云原
-
3新趨勢(shì)·新未來(lái) | 2019第六屆中國(guó)嬰幼
-
4【金猿產(chǎn)品展】中原銀行智能化BI:一站式
-
5【金猿產(chǎn)品展】易觀方舟:智能用戶數(shù)據(jù)中
-
6【金猿人物展】張涵誠(chéng): 2020年大數(shù)據(jù)產(chǎn)
-
7小飯桌2019全球青年創(chuàng)業(yè)者大會(huì)圓滿舉辦,
-
8繁華之下有隱憂,零售企業(yè)如何走出增長(zhǎng)困
-
9【金猿產(chǎn)品展】羽扇決策引擎平臺(tái):運(yùn)籌帷
-
10【金猿案例展】國(guó)網(wǎng)上海市電力:智能配用