首頁 資訊正文

化繭成蝶,人工智能引領新發展

隨著社會信息化的飛速發展,一項劃時代的技術正在掀起新的技術革命浪潮,那就是人工智能(AI)。

自1956年“人工智能”一詞第一次出現在達特茅斯會議上,已經過去60多年。在經歷了第一階段的符號主義、第二階段的數學建模之后,人工智能來到了以移動互聯網、大數據、超級計算、萬物互聯為技術基石的信息時代。在算法和計算能力的驅動下,這項曾經只在科幻小說里被人們津津樂道的技術,終于化繭成蝶,第一次真真切切地站在普通大眾面前,以AlphaGo在圍棋領域顛覆性的勝利為標志,宣告了信息時代又一次新技術革命的到來。

當前,新冠肺炎疫情仍在肆虐,一方面全球經濟深度衰退的風險揮之不去;另一方面,全球新一輪科技革命和產業變革持續演進。在“十四五”開局的新階段,高質量發展對于技術創新和產業變革有著迫切需求。人工智能作為新興技術,有望在新的變革中發揮驅動和引擎作用。

人工智能:信息社會的核心技術

“人工智能是利用數字計算機或者由數字計算機控制的機器,模擬、延伸和擴展人類的智能,感知環境、獲取知識并使用知識獲得最佳結果的理論、方法、技術和應用系統。”

——《人工智能標準化白皮書(2018年)》

當今社會已經進入信息時代。信息社會的主要資源就是信息。這些信息資源及其以大數據、人工智能、云計算和網絡通信為主的信息處理技術共同形成信息產業,逐步在經濟和社會發展中發揮主導作用。當信息的共享突破時空限制的時候,所有人類高端的生產、生活、學習形態都以信息的獲取、存儲、處理以及再產生為基本模式。這其中又以信息處理環節為核心。而人工智能技術正是借助算法和計算能力,仿照人腦同時在很多方面超越人腦的信息處理技術,因此人工智能技術將是構成信息社會的核心技術。

鑒于人工智能技術對信息社會的重大推動作用,我國將人工智能作為戰略性新興產業,同時部署了智能制造等國家重點研發計劃和專項,對人工智能產業予以大力扶持。

2017年7月國務院發布的《新一代人工智能發展規劃》對人工智能的發展制定了三步走目標:第一步,到2020年人工智能總體技術和應用與世界先進水平同步,人工智能產業成為新的重要經濟增長點;第二步,到2025年人工智能基礎理論實現重大突破,人工智能成為帶動經濟轉型的主要動力;第三步,到2030年人工智能理論、技術與應用總體達到世界領先水平,成為世界主要人工智能創新中心。

2020年8月,國家標準化管理委員會、中央網信辦、國家發改委、科技部、工業和信息化部五部門聯合印發的《國家新一代人工智能標準體系建設指南》要求,建立國家新一代人工智能標準體系,加強標準頂層設計與宏觀指導。

2021年3月,《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》(以下簡稱“綱要”)正式發布。在共19篇65章的綱要全文中,“智能”“智慧”相關表述達57處,這表明在當前我國經濟從高速增長向高質量發展的重要階段中,以人工智能為代表的新一代信息技術,將成為我國“十四五”期間推動經濟高質量發展,建設創新型國家,實現新型工業化、信息化、城鎮化和農業現代化的重要技術保障和核心驅動力之一。預計到2025年,人工智能產業規模超過4500億元。中國有望成為世界上最大的人工智能市場,未來5年的年均復合增長率超40%。我們正站在又一次技術大變革時代的門口。

工業革命中出現了動力和機器,曾經大量繁重的體力工作被機器所替代,從而大大提高了社會的生產效率。人工智能的出現也將把人們從繁重的腦力勞動中解放出來。人工智能技術是知識和數據雙驅動下的產物,隨著信息社會中數據的膨脹,人工智能的數據樣本趨于豐富,人類的一些規則明確、煩瑣單一的腦力勞動直至分析、決策、規劃等高端腦力勞動都可以逐步被人工智能所替代。人工智能技術給人類帶來的影響,可能遠遠超過計算機和互聯網在過去幾十年間給人類世界帶來的改變。 (諾文)

未來挑戰:確保人工智能安全

作為引領新一輪科技革命和產業變革的核心驅動力量之一,人工智能近年來被廣泛應用于金融、電商、醫療等領域。風生水起之余,人工智能產業也暗藏隱憂:隨著全球人工智能規模化建設和應用的加速,人工智能基礎設施、設計研發及融合應用面臨的安全風險正日益凸顯。近日,在互聯網安全大會(ISC 2021)的“中國人工智能安全創新峰會”上,專家學者、機構及業界代表等圍繞人工智能安全發展趨勢及最新研究成果與應用等前沿話題展開探討。在大咖們看來,人工智能產業健康有序發展,安全是重要保障,是形勢所需,也是一些技術落地不可或缺的前提。

AI安全不容忽視

人工智能技術是一把“雙刃劍”,在推動數字經濟社會創新發展的同時,也可能引發一系列安全挑戰。北京大學教授陳鐘從人工智能賦能網絡攻擊的新興威脅場景、技術現狀、發展趨勢以及應對之道進行了詳細解讀,他表示未來網絡安全將呈現零信任、無邊界、賽博化的特點,人工智能面臨著軟件漏洞、系統安全、網絡安全、傳感器欺騙、數據投毒五大威脅。因此人工智能系統在被廣泛使用之前,需要保證系統將以受控、充分定義和充分理解的方式安全地操作。陳鐘強調,需要進一步加強對人工智能技術的攻關,積極探索人工智能與區塊鏈的融合發展,使互聯變互信,創造更加安全、可信的美好未來。

中國科學院大學教授、博士生導師、密碼學院院長、數據保護研究中心主任荊繼武分享了他對智能時代信息化發展形勢的判斷,講述了信息安全技術的新方向——白盒化。他表示,人工智能技術正在加速網絡共同體的形成,安全技術將逐步走向開放化、白盒化,他以“密碼算法的保密與開放”“技術細節的保密與開放”為例對其進行深入解讀。他強調,白盒化的安全是未來全球安全市場的重要方向,它的發展需要得到市場的支持,公開體系結構,從而推動安全技術產品的專業化完善和深度融合。

目前,真正能代表人工智能前沿發展的莫過于深度學習,尤其是深度學習在無人駕駛、醫療決策等領域的應用。浙江大學“百人計劃”研究員、博士生導師、浙江大學濱江研究院國產信創研究中心副主任紀守領以《深度學習模型的安全可解釋性與魯棒性》為主題分享了在深度學習模型上的研究成果,并從對抗樣本攻防對深度學習模型的魯棒性進行了拆解,從模型層面、數據層面、承載系統層面對深度學習模型的安全性進行分享。

AI對抗開辟網絡安全新戰場

中科院信息工程研究所副主任陳愷通過實例向觀眾展示了如何利用聲音、圖像中的噪聲信息“騙”過人工智能大腦,對抗自動駕駛目標識別系統。他表示,人工智能技術雖然廣泛應用于計算機視覺、自然語言處理、自動駕駛等領域,但人工智能系統容易受到攻擊,限制了其在關鍵安全領域的應用。因此提高人工智能系統對抗攻擊的魯棒性在人工智能進一步發展中發揮著越來越重要的作用。陳愷表示只有掌握了各種攻擊方式對于人工智能造成干擾的原因,才更有能力確定相應的防御思路,在模型之前可以放一些檢測器檢測對抗樣本,以此提升網絡的安全性能。

目前,針對網絡空間的攻擊無所不在,網絡安全與治理已經成為學術界和產業界共同關注的科技前沿問題。北京郵電大學教授李小勇以《AI及威脅情報驅動的跨網系行為檢測與異常發現》為題,從網絡空間安全與威脅情報、威脅情報的發展與應用、AI及威脅情報驅動的跨網系異常檢測三個方面進行了分享。他指出,利用異構多源行為大數據高效感知、IP流量異常行為高效識別與利用、空口異常行為精準識別與利用、跨網系異常行為融合分析與態勢感知等關鍵技術可以進行跨網系異常檢測,智能威脅云的情報可以減少攻擊面、監測未知威脅、實時安全防護,實現智能防御。

共建開放創新的AI安全生態

近年來,人工智能技術的發展和應用不斷推動著網絡安全攻防自動化和智能化水平的提高,目前已經在惡意代碼檢測、惡意流量分析、漏洞挖掘、僵尸網絡檢測、網絡灰產檢測等領域有了廣泛的應用。360集團AI安全實驗室主任鄒權臣表示,各個場景、各個領域的人工智能系統都存在著被攻擊和被欺騙的可能,因此亟須構建人工智能安全創新環境,通過開源開放與高等院校和科研院所進行對接與成果轉化,促進人工智能安全行業持續、健康、快速發展。

數字化轉型驅動技術變革,傳統的IT架構被顛覆,未知威脅變得更隱蔽,因此智能、堅固的安全體系比以往任何時候都重要,因此構建主動感知、敏捷智能、精準預警、全時可用的云網邊端一體化安全防護體系成為關鍵。新華三技術有限公司安全研究院院長顧成杰強調,云智原生將賦予企業和組織與生俱來的云與智能的架構和能力,加速釋放數據價值,企業要以原生的思維構建云安全體系,驅動安全與云計算深度融合;通過全域同構,實現公有云、私有云、邊緣云多場景的安全統一、極簡運營、一致體驗;通過多云管理,打造同構/異構多云安全一體化服務,實現本地和公有云側的安全能力。

隨著人工智能技術步入快車道,人工智能芯片使用成本的快速降低,深度學習框架等核心技術的開源與共享,AIoT智能硬件的快速發展,均在助力人工智能行業成功破圈。在智能物聯網(AIoT)時代,智能硬件產品正在逐步融入我們的生活,進一步改變我們的生活方式。360智慧生活集團技術中心總經理、360集團硬件專業委員會執行主席孫浩表示,這個趨勢對應的是AI算力的平民化、邊緣化,即使在算法理論沒有進一步突破的前提下,AI也能夠憑借更加低廉的硬件結合邊緣,融入終端設備,走入生活給整個行業帶來巨變。

可以預見,數字時代,人工智能作為最具顛覆性和戰略性的核心關鍵技術,與網絡安全相輔相成。人工智能可以提升網絡安全工作的效率,網絡安全也要為人工智能的發展保駕護航。但人工智能安全不是任何一家公司、社區能夠獨立解決的問題,因此,需要構建開放創新的AI安全生態,助力人工智能技術穩健發展。(語沐)

AI應用:OCR如何讓日常辦公更高效?

人工智能時代的來臨,正在給社會的方方面面帶來深刻變化。特別是面對具有大量數據處理需求的日常辦公場景,人工智能往往可以“大展身手”。眾所周知,文字是人們信息交流的重要載體,從吃穿住行到日常辦公生活,乃至一部電影都需要字幕輔助人們理解各類內容。相較圖像、視頻中的內容,文字往往包含更強的語義信息,因此對圖像中的文字提取和識別具有重大意義。與人工智能相結合的光學字符識別(OCR),在基礎感知識別的基礎上逐漸增添了在復雜自然場景下精準識別并理解各類有效信息的能力,可以將生活中的文字等非結構化數據轉化為結構化、數字化的數據,大幅提高人們的日常辦公效率。

何為OCR?根據業界公認定義,光學字符識別(OCR)是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成數據的過程;即針對印刷體字符,采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件,并通過識別軟件將圖像中的文字轉換成文本格式,供文字處理軟件進一步編輯加工的技術。目前,OCR最廣為人知的應用是各類文檔的掃描并將其輸入為可編輯的數據,其已成為業界公認的OCR底層應用。

OCR概念早在1929年便被提出,時至20世紀六七十年代,世界范圍內便有多個國家開始了OCR領域的研究,以日本為例,其在1960年前后開始研究OCR的相關識別理論,初期以數字為研究對象,經過10年左右的時間研發出部分功能簡單的應用,如印刷文字的郵政編碼識別系統,其可以識別郵件上的郵政編碼,助力當地郵局進行區域分信作業。類似于上述識別郵政編碼的簡單應用,業界普遍認為OCR是有能力協助人類解決生活中一些感知層面問題的。什么是感知層面的問題?舉例而言,做人臉、文字的識別,這些都是屬于感知層面的問題。假如數據的體量足夠大,做一個人臉識別的引擎,或者一個簡單的印刷場景的文字識別引擎,是較為容易的。

OCR已經逐漸從感知識別“進化”到認知理解。隨著OCR的應用越來越廣泛,對特殊場景的文字進行識別的需求也迅速增多,目前的OCR已經無法滿足需求。相較識別印刷體場景,在復雜場景中的識別往往面臨以下三個難點:一是成像復雜,包括噪聲、模糊、光線變化、形變。二是文字復雜,包括字體、字號、色彩、磨損、隨機的字間距以及方向。三是場景復雜,包括版面缺失和背景干擾。

如若沒有人工智能的加持,OCR很難達到使用者的預期目標。舉例而言,我們想要識別一家烤肉店的門頭,由于其招牌上的“烤肉”二字使用藝術字體,并且該OCR應用沒有人工智能的輔助,則識別結果很可能是“火”“考”“肉”三個字,與原義相去甚遠。因此,OCR不僅要識別文字,更要理解語義。華南理工大學電子與信息學院教授、廣東省琶洲實驗室OCR中心主任金連文對本報記者表示,只有利用數據和知識,才能使我們解決OCR認知理解的問題,“所謂知識就包括物理常識、各領域知識、語義知識,以及從海量數據中學習到的知識”。

在深度學習的加持下,OCR將繼續發光發熱。人工智能特別是深度學習技術的發展和迅速普及,給OCR帶來了新的發展機遇。以人們日常生活中經常遇到的手持身份證照相識別的場景為例。由于身份證目標在圖像中的所占比例往往是較小的一部分,直接提取微小候選目標無法保證精度。為了保證高召回和高定位精度,一般采用由粗到精的策略進行識別。第一步利用Faster R-CNN框架定位身份證在照片中所在區域,第二步在身份證區域位置對所需要的姓名、身份證號等信息進行精確的檢測識別。而Faster R-CNN框架是目前深度學習領域較為火熱的技術概念,其由RPN(候選區域生成網絡)和RCN(區域分類網絡)兩個子網絡組成。RPN通過監督學習的方法提取候選區域,給出的是無標簽的區域和粗定位結果。RCN則引入類別概念,同時進行候選區域的分類和位置回歸,給出精細定位結果。

在融入深度學習后,對于一些門頭招牌、酒水菜單、發票等復雜場景的識別精準度會大幅提高。以智能報銷系統為例,針對增值稅發票,包括電子發票、普通發票、專用發票、卷式發票等,通過OCR識別以及與國家稅務總局服務器發票驗真接口的結合,可以極大提高發票識別校驗的準確率和效率。OCR技術除了能夠識別增值稅發票上的發票號、發票日期、密碼區、稅率、金額、稅額等信息之外,還能識別發票明細、備注欄等信息,以滿足三單匹配等需要。金連文表示,一張發票中的信息有很多,如何提取其中最為關鍵的有效信息,是接下來智能報銷系統的發展目標。

“我們不僅要教會計算機‘認字’,更要教計算機理解這個字后面的語義信息和結構化信息。”金連文表示,在不遠的未來,OCR識別檢測出來結果的同時可以自動提取有效信息,即文檔的結構化理解,如若其能夠得到落地實踐,那么接下來更加智能化、商業化的OCR應用也將不斷涌現,智慧辦公必將成為現實。 (趙樂瑄)

AI讓老照片“笑”起來

“AI還原李煥英老照片動態影像”視頻截圖

電影《你好,李煥英》上映以來感動了萬千觀眾,一組李煥英年輕時的黑白老照片亦在網上熱傳。近日,獨立藝術家胡文谷借助人工智能技術(AI),將李煥英的老照片復原為彩色動態影像,她的一顰一笑驚艷了觀眾,網友紛紛留言“瞬間淚崩,這個微笑太美了”。

在“AI還原李煥英老照片動態影像”視頻中,胡文谷借助人工智能,一步步還原照片色彩、增強清晰度、精修面部、手繪微調,最后讓人物面部動起來,讓老照片重新煥發生命力,“希望以此向每位母親致敬”。在過去的一年里,胡文谷還曾用人工智能復原90年前的上海時裝秀,還原兵馬俑、蘇軾、宋明清皇帝的立體動態長相等,不少作品引發網絡熱議。

“其實,我仍然是AI的入門研究者,學習人工智能是為了嘗試能否為游戲開發節省時間和成本,后來發現AI能做的事情有很多。”胡文谷從很小的時候就對計算機產生了強烈興趣,上初中、高中時在課余時間嘗試制作了許多Flash動畫短片和小游戲。從小學習鋼琴的他,后來學習了電子音樂創作,還常常為自己的游戲作品配樂,讓人工智能續寫貝多芬、巴赫的旋律,可謂“程序員里最會畫畫的作曲家”。

將想象變成現實,是推動胡文谷持續創作的不竭動力。“人工智能具有深度學習能力,在社會人文科普方面有著很有意思的應用前景。”未來,他希望不僅讓老照片、歷史畫像里人物的面部動起來,還能進一步讓人物全身“復活”,讓人工智能為歷史人文科普做更多事。

責任編輯:藺弦弦

分享:
可以触碰你的深处吗开车视频