2018年4月7日至6月9日,張學(xué)友在南昌、贛州、嘉興、金華舉辦了4場巡回演唱會,警方在前三場演唱會現(xiàn)場各抓獲了一名在逃犯人,在金華演唱會上更有兩名逃犯落網(wǎng)?!案枭瘛睆垖W(xué)友也成了“逃犯克星”。
這一切是怎么發(fā)生的呢?原來,在演唱會的安檢門,公安部門設(shè)置的攝像頭可以逐一捕捉到進(jìn)入演唱會人員的人臉圖像。之后通過和后端數(shù)據(jù)庫進(jìn)行人臉識別比對,這樣就可以幫助警方抓獲逃犯。
這就是人工智能“人臉識別”的威力。
人臉識別,是計(jì)算機(jī)視覺領(lǐng)域的一個重要的應(yīng)用。
5億4000萬年前,地球上出現(xiàn)了第一個擁有視覺的動物三葉蟲。今天的人類所擁有的視覺能力,也是經(jīng)歷了漫長的歲月進(jìn)化迭代才形成的。
對于人類的視覺來說,眼睛只是捕捉光線的鏡頭,真正能夠?qū)θ搜劭吹降膱D像進(jìn)行處理識別的是大腦。我們?nèi)祟惖拇竽X皮層有三分之一是用于視覺計(jì)算的。
視覺是人類最重要的感知系統(tǒng),人類所接受的大部分信息來自視覺。
模仿人類的視覺,計(jì)算機(jī)也可以擁有視覺。
要想讓計(jì)算機(jī)擁有視覺,必須使用人工智能技術(shù)。在計(jì)算機(jī)視覺領(lǐng)域,中國涌現(xiàn)了很多有創(chuàng)造力的人工智能公司。
排名 | 企業(yè) | 簡介 |
---|---|---|
1 | 商湯科技 | 致力于計(jì)算機(jī)視覺和深度學(xué)習(xí)原創(chuàng)技術(shù)的創(chuàng)新型科技公司,總部位于北京 |
2 | 百度 | 最早布局人工智能的巨無霸公司之一,最近發(fā)布了“阿波龍”無人駕駛汽車 |
3 | 曠視科技 | 擁有世界領(lǐng)先的智能算法、硬件技術(shù)、行業(yè)方案,提供人臉識別、智能地產(chǎn)、智能安防等系統(tǒng)解決方案 |
4 | 云從科技 | 致力打造計(jì)算機(jī)視覺中國智造的人工智能企業(yè),核心團(tuán)隊(duì)曾獲7次智能識別世界冠軍。擁有中國科學(xué)院與上海交通大學(xué)兩大聯(lián)合實(shí)驗(yàn)室 |
5 | 阿里巴巴 | 推出ET人工智能機(jī)器人,擁有圖像與視頻識別技術(shù) |
6 | 依圖科技 | 2017年6月份的國際權(quán)威人臉識別供應(yīng)商測試FRVT中,該公司在千萬分之一誤報(bào)下達(dá)到識別準(zhǔn)確率95.5%,是全球工業(yè)界在此項(xiàng)指標(biāo)下的最好水平 |
7 | 格靈深瞳 | 同時(shí)具備計(jì)算機(jī)視覺和深度學(xué)習(xí)技術(shù)以及嵌入式硬件研發(fā)能力的人工智能公司 |
8 | ??低?/td> | 全球領(lǐng)先的以視頻為核心的物聯(lián)網(wǎng)解決方案提供商,致力于不斷提升視頻處理技術(shù)和視頻分析技術(shù) |
9 | 大華股份 | 監(jiān)控產(chǎn)品供應(yīng)商和解決方案服務(wù)商,面向全球提供領(lǐng)先的視頻存儲、前端、顯示控制和智能交通等系列化產(chǎn)品 |
10 | 朗鏡科技 | 致力于運(yùn)用世界領(lǐng)先的計(jì)算機(jī)視覺技術(shù)和大數(shù)據(jù)挖掘與分析服務(wù)幫助品牌商、零售商實(shí)時(shí)獲取渠道終端商品信息,實(shí)現(xiàn)消費(fèi)決策場景可視化、數(shù)據(jù)化、實(shí)時(shí)化。 |
11 | 碼隆科技 | 注于引領(lǐng)深度學(xué)習(xí)與計(jì)算機(jī)視覺技術(shù)突破的人工智能公司,致力于打造全球領(lǐng)先的視覺決策引擎 |
12 | 縱目科技 | 主要研發(fā) 2D 和 3D 全景視覺輔助駕駛系統(tǒng),及自動停車和駕駛記錄系統(tǒng)等 |
13 | 陌上花科技 | 公司旗下品牌Yi+是人工智能計(jì)算機(jī)視覺引擎,衣+是時(shí)尚商品搜索引擎。 |
14 | 云天勵飛 | 專注于視覺智能領(lǐng)域,以深度學(xué)習(xí)和新型處理器技術(shù)為核心的創(chuàng)業(yè)公司 |
15 | 圖普科技 | 提供網(wǎng)絡(luò)圖像內(nèi)容審查業(yè)務(wù)服務(wù),識別色情、暴恐、時(shí)政敏感信息、小廣告等違規(guī)圖片和視頻 |
16 | 深醒科技 | 在識別動態(tài)模糊拍攝和暗光拍攝的人像上有技術(shù)優(yōu)勢,目前已面向安防監(jiān)控、金融、地產(chǎn)、學(xué)校、醫(yī)院等領(lǐng)域提供多種解決方案 |
17 | 速感科技 | 以機(jī)器視覺為核心的人工智能創(chuàng)業(yè)公司,以機(jī)器視覺為主要核心模塊面向不同應(yīng)用用戶進(jìn)行定制化的系統(tǒng)設(shè)計(jì) |
18 | 閱面科技 | 人工智能企業(yè),專注于深度學(xué)習(xí)和嵌入式視覺,為智能機(jī)器提供的視覺識別技術(shù),包括面部識別、手勢識別、人體識別以及環(huán)境感知 |
19 | 瑞為技術(shù) | 圖像智能感知產(chǎn)品與解決方案提供商。在智慧商鋪、智能家電、車載智能、智能安防等領(lǐng)域均有規(guī)模產(chǎn)品應(yīng)用。 |
20 | 臉云科技 | 開創(chuàng)了基于深度學(xué)習(xí)的人臉檢測創(chuàng)新算法,搭建了一套高效穩(wěn)定的人臉分析系統(tǒng) |
2018《互聯(lián)網(wǎng)周刊》&eNet研究院選擇排行 |
計(jì)算機(jī)視覺是用電腦去識別物體的一種新技術(shù)。作為視覺來講,必須要有眼睛與大腦兩部分。計(jì)算機(jī)視覺的主要組成部分不是“眼睛”,而是“大腦”。
2011年,計(jì)算機(jī)視覺迎來了最偉大的突破。當(dāng)年,谷歌人工智能實(shí)驗(yàn)室的杰夫·迪恩與斯坦福大學(xué)計(jì)算機(jī)系教授吳恩達(dá)合作,他們動用上萬臺電腦的計(jì)算資源,讓計(jì)算機(jī)用深度學(xué)習(xí)算法在YouTube上觀看了一千萬段關(guān)于貓的視頻,最后計(jì)算機(jī)終于完成了“貓臉識別”。這個項(xiàng)目是谷歌大腦在計(jì)算機(jī)視覺領(lǐng)域取得的巨大成功。
到了2014年,計(jì)算機(jī)視覺領(lǐng)域的ImageNet比賽第一次超越了人類肉眼識別圖片的準(zhǔn)確率——這標(biāo)志著計(jì)算機(jī)視覺已經(jīng)比人眼更加精準(zhǔn),因此具有極大地應(yīng)用價(jià)值。
ImageNet國際挑戰(zhàn)賽是計(jì)算機(jī)視覺領(lǐng)域最著名的比賽,被譽(yù)為國際計(jì)算機(jī)視覺領(lǐng)域的“奧林匹克”。它是2010年由美國斯坦福大學(xué)人工智能實(shí)驗(yàn)室的李飛飛教授主導(dǎo)推出的。早在2009年,ImageNet對1500萬張圖片進(jìn)行了標(biāo)注,涉及22000個類別的物體,李飛飛她們建立了一個規(guī)??涨暗臄?shù)據(jù)庫。而且,她們公開了整個數(shù)據(jù)庫,免費(fèi)提供給全世界的人工智能研究團(tuán)隊(duì)。有了這個培育計(jì)算機(jī)大腦的數(shù)據(jù)庫,科研工作者教會了計(jì)算機(jī)識別物體。
計(jì)算機(jī)視覺的基本原理
想要實(shí)現(xiàn)計(jì)算機(jī)視覺,首先需要有一個攝像頭,然后把拍攝的照片成像在CCD上形成電子照片。這些電子照片是以像素為單位存儲在計(jì)算機(jī)上的。每一個像素都可以看成是三個矩陣元,這些矩陣元給出了像素的RGB數(shù)值(每個數(shù)值都是整數(shù),取值在0到255之間)。其中,R表示紅色,是red的首字母; G表示綠色,是green的首字母;B表示藍(lán)色,是blue的首字母。有了這三種基本顏色,就可以按照不同的權(quán)重疊加出千變?nèi)f化的色彩。
計(jì)算機(jī)視覺所處理的主要對象就是這個RGB數(shù)值,因?yàn)槊恳粡堈掌南袼睾芏啵虼苏麖堈掌梢员豢闯墒侨齻€大的矩陣。
計(jì)算機(jī)視覺的本質(zhì),其實(shí)就是處理這三個矩陣,然后從這三個矩陣中提取出“特征信息”,比如對于動物的圖片,可以提取的特征是“有沒有尾巴?”以及“有沒有毛?”等。通過對特征信息的提取與判斷,可以實(shí)現(xiàn)“貓臉識別”或者“人臉識別”。人工智能是通過機(jī)器學(xué)習(xí)的方法,提取不同物體的特征,然后用分類器對各種事物進(jìn)行分類識別。
計(jì)算機(jī)視覺的頭部公司之一商湯科技與華東師范大學(xué)合作,編寫了中國第一本人工智能教材《人工智能基礎(chǔ)(高中版)》,在書中詳細(xì)介紹了計(jì)算機(jī)視覺的算法實(shí)現(xiàn)及其基本原理。
計(jì)算機(jī)視覺有哪些相關(guān)企業(yè)與落地應(yīng)用?
計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用非常廣泛,其主要的落地應(yīng)用有以下幾個大類。
在安防攝像頭領(lǐng)域,主要有無人值守的場地看管、刷臉門禁、以及發(fā)現(xiàn)異常自動報(bào)警裝置等。在這里主要的代表性公司有海康威視、大華股份等傳統(tǒng)大公司與商湯科技、云從科技、依圖科技以及曠視科技等獨(dú)角獸企業(yè),這四家公司被稱為人工智能計(jì)算機(jī)視覺的“四小龍”,它們的產(chǎn)品在本文一開頭提到的張學(xué)友演唱會上抓逃犯的過程中發(fā)揮了重要作用。
在交通攝像頭領(lǐng)域,主要是識別車輛車牌,進(jìn)而進(jìn)行車輛套牌分析、交通違章分析等智慧城市解決方案。在這個領(lǐng)域的人工智能計(jì)算機(jī)視覺的頭部公司有格靈深瞳等。
在金融領(lǐng)域,計(jì)算機(jī)視覺主要用于快速信貸審核、刷臉支付與刷臉開戶等應(yīng)用。在這個行業(yè)的代表性企業(yè)有商湯科技、曠視科技Face++等。
在醫(yī)療領(lǐng)域,計(jì)算機(jī)視覺主要用于智能診斷與疾病研究和精準(zhǔn)醫(yī)療方面。在這個垂直領(lǐng)域的代表性企業(yè)有阿里云ET醫(yī)療大腦等。
在汽車領(lǐng)域,計(jì)算機(jī)視覺主要用于無人駕駛,代表性的企業(yè)是百度。百度最近與金龍汽車合作發(fā)布了阿波龍無人駕駛汽車。
在無人機(jī)領(lǐng)域,計(jì)算機(jī)視覺主要應(yīng)用于物流運(yùn)輸以及路徑規(guī)劃、地質(zhì)災(zāi)害監(jiān)控等。在這個領(lǐng)域的代表性企業(yè)是大疆科技。
除了以上的垂直領(lǐng)域,人工智能計(jì)算機(jī)視覺還有非常多的應(yīng)用領(lǐng)域,比如在手機(jī)領(lǐng)域,計(jì)算機(jī)視覺主要用在美圖拍照與直播特效等領(lǐng)域;在虛擬現(xiàn)實(shí)領(lǐng)域,計(jì)算機(jī)視覺主要用于虛擬現(xiàn)實(shí)游戲以及3維電影等領(lǐng)域。
計(jì)算機(jī)視覺已經(jīng)落地并且全面開花,《互聯(lián)網(wǎng)周刊》整理了中國在計(jì)算機(jī)視覺領(lǐng)域的人工智能公司排行榜。
人工智能計(jì)算機(jī)視覺的核心競爭力分析
深度學(xué)習(xí)算法已經(jīng)打破了圖片分類的瓶頸,而且也突破了物體識別的技術(shù)瓶頸。物體識別的技術(shù)難度比圖像分類要高。圖片分類問題只需要判斷圖片中包含哪個物體,而物體識別則需要在同一張圖片包含多個物體時(shí),給出所包含物體的具體位置。
目前,基于深度學(xué)習(xí)算法的計(jì)算機(jī)視覺已經(jīng)實(shí)用化,張學(xué)友演唱會上警方抓逃犯的成功案例說明人工智能在計(jì)算機(jī)視覺方面已經(jīng)真正落地了。
當(dāng)然,人才依然是人工智能計(jì)算機(jī)視覺的核心競爭力。以商湯科技為例,商湯科技的創(chuàng)始人之一是香港中文大學(xué)的湯曉鷗教授,其CEO徐立也擁有人工智能的博士學(xué)位。在商湯科技,有150個博士,這無疑是其核心競爭力的體現(xiàn)。
計(jì)算機(jī)視覺的核心并不在于攝像頭,也不在GPU,因?yàn)檫@些都可以在公開市場上買到。對于企業(yè)來說,買不到的核心技術(shù)是人工智能的算法——這些算法需要相應(yīng)的人才去編寫去改進(jìn),只有不斷研究新的算法,改進(jìn)現(xiàn)有的算法,才可能讓人工智能工作地越來越好。
人工智能計(jì)算機(jī)視覺雖然取得了長足的發(fā)展,但想要在這一領(lǐng)域擁有一席之地,企業(yè)必須擁有真正掌握人工智能算法的核心技術(shù)人員。否則隨著時(shí)間的推移,在人工智能的融資退潮之后,那些沒有掌握人工智能算法的企業(yè)都會被人發(fā)現(xiàn)其實(shí)是在“裸泳”。
(文/軒中)