人民網
人民網>>經濟·科技

科大訊飛高級副總裁杜蘭:人機耦合給生活帶來更多新變化

2018年09月09日14:47 | 來源:人民網
小字號
科大訊飛高級副總裁杜蘭:人機耦合給生活帶來更多新變化

人民網深圳9月9日電 今日,由人民日報社和招商局集團聯合主辦的“新時代、新產業、新動能——2018中國新產業峰會”在深圳舉行,科大訊飛高級副總裁、博士杜蘭在會議上表示,人工智能將會給我們帶來什麼?A.I.賦能,世界的下一種可能,每一個人掌握了A.I.,會使自己更強大,人機耦合的方式會給生活和生產帶來更多新變化。

以下為杜蘭發言全文:

非常高興今天能夠參加由人民日報社和招商局集團共同主辦的中國新產業峰會,其實我們也知道,不論是人民日報還是招商局集團,在整個經濟社會的發展中,都起到了非常重要的不同領域的引領作用。而人工智能今天要想獲得新的發展,就必須要和這樣的企業,和這樣的一些單位在一起,共同去走進一個新的時代,而且是共同地開拓更多的無限的可能。剛剛看到麥肯錫在周三發布了最新的報道,指出未來AI會是新時代的蒸汽機,而且在不到十年的時間,我們會有70%的企業用上人工智能。

人工智能將會給我們帶來什麼?A.I.怎樣給世界賦能。我們可以讓機器模仿人說話聲音,這就是語音合成能力的表現。今天我們為了實現這樣一個技術,實際上隻要一個小時的有效音頻就可以達到了。我們看到,越來越多的技術的發展,給我們社會帶來了非常多的想象的空間,也帶來了無限的可能。

在去年,我認為有一件事情讓大家把科大訊飛優點是低調,缺點是過於低調的公司,出現在公眾的視野裡,就是在2017年6月份,MIT著名的麻省理工科技評論進行了評選,每年都會將最具創新能力的一些技術進行榜單公布。在去年公布“全球50大最具技術創新力企業”的時候,我們看到中國已經有九家企業上榜了,大陸七家,台灣兩家,我們看到科大訊飛這樣的企業處於全球第六,中國第一的成績。實際上越來越多的人認識到中國的企業在人工智能這場浪潮中獲得非常好的發展機遇。

我們看到下一步發展中,我們發現在整個的過程中,人工智能被中國科技部和國家在各種產業規劃裡進行一些非常高度的重視,而且我們看到,人工智能產業的國家隊也誕生了。去年11月份發布了一個BATI新一代人工智能發展平台,包括科大訊飛的智能語音,百度的無人駕駛,阿裡巴巴的城市大腦和騰訊的醫療影像,是橫跨各個應用場景的人工智能的方向上進行更多的拓展。我們也會看到,人工智能在中國已經在集聚各種各樣的力量。

去年8月份已經有一些媒體知道這樣一個消息,但是我們是10月份才公布的。媒體當時用了這樣一個標題,叫做“逆天了”,來表達他們對此驚訝的心情。在去年,我們全球第一個通過國家醫師資格認証考試筆試的機器人誕生了。8月份我們參加全國醫學資格考試,后來我們看到這個成績,滿分是600分,及格分是360分,我們機器人考了456分,這意味著什麼?就是說,它超過了96.3%人類考生的成績,也就意味著它在人類比賽過程中處於前3.7%的位置。這樣的一個機器人的誕生,實際上像國家衛計委曾經提出來的,中國每個家庭希望到2020年都有一個醫生為大家提供服務,我想在今天,中國社會的環境下,我們的機器人醫生會是一個非常好的幫手。

我們看到人工智能已經發展到了一定的階段,大家對此是眾說紛紜的。究竟它是一個泡沫還是一個威脅,它會給我們帶來什麼?在2014年,科大訊飛首先提出來了我們的觀點,我們認為,人工智能,我們把它分成三個階段,我們要看到我們的技術的邊界,今天、明天和后天能做什麼,我們究竟能夠為人類帶來哪些這樣的變化。

首先看到第一個階段,我們的運算智能,實際上就是機器能存會算的能力。這個能力在阿爾法狗戰勝了人類,戰勝了李世石,戰勝了柯潔之后已經成為事實,機器在運算能力上已經超過了人類。

在第二個階段就是感知智能。指的是我們的機器能看會認和能聽會說的能力。而大家如果用訊飛輸入法,已經可以聽懂你的說話了。這樣的能力,實際上我們在部分領域也已經是超過人類的能力了。

第三個階段是認知智能。認知智能是讓機器像人一樣去理解和思考的能力。在這個階段,不論是中國和美國都是進入一個無人區。即使我們在一些認知智能上不斷獲得突破,但是機器離人的能力實際上還有一定的差距的。

我們看到人工智能的階段之后就要去思考,我們今天究竟怎樣來實現它。比如,我們發現在幾百種非常多的算法過程中,我們看到深度神經網絡這個算法是最有效的一個方式,也是我們現在工業界為了實現人工智能的各種各樣的應用採用的最多的方法。但是,它和人腦的思考相比,會耗費大量的數據。

我們也看到第二種路徑就是全腦模擬。今天不論是美國、中國、歐盟,我們都加入到這樣的過程中,就是希望用這樣的技術來模擬整個人腦的生物過程。像2014年中國科技部提出來了腦計劃,也是由科大訊飛來牽頭進行,我們也是推出了我們的訊飛超腦,這一點也是希望能夠在一定領域獲得一些突破。

但是對於我們大家非常有啟發的一個事情就是今天,我們希望看到,就是我們過去在模仿鳥類飛行的時候,我們並不是去制造它的翅膀,而是模仿了空氣動力學,用這樣的動能讓我們今天人類能夠在空中去飛翔。在智能領域,智能動力學也一樣,它是模仿探索人類思考的人腦運轉的奧秘,然后通過電子線路來實現它。這樣就有可能產生我們今天大家非常關注的超腦。同樣,這種智能就會出現,也會給我們帶來非常非常多的無限的想象空間。

大家看到我們的成績單,科大訊飛在這麼多年來進行一些努力的時候,我們在語音識別、語音合成、自然語言理解、機器口語翻譯、語音評測,后面在圖像的理解和識別等諸多領域都是代表了全球比較高的水平,我們在各種比賽中都拿了全球第一。我想告訴大家,分享的比較多的一個成果,就在前天,9月7號,我們剛剛在全球最權威的語音識別領域的比賽中獲得了四項任務世界第一的成績。為什麼說這一次的比賽特別值得強調呢?因為它被譽為史上最難的語音識別任務的比賽。因為在這個比賽過程中,我們既有遠場的情況,又有高噪聲,還有混響的情況下,怎麼樣機器識別。特別是當人進行自由交談的過程中,我們的機器在分布式麥克風陣列識別的效果比我們近場識別的效果還要強。這個比賽說明我們不僅僅是在中文語音識別上獲得了全球最好的水平,在英文語音識別上也依然是代表了全球最領先的水平。我們也看到,因為分布式麥克風陣列的識別效果非常好,未來我們各種各樣的場景下的語音識別和理解的可能性就會越來越多。我們也看到,在這個裡面大家都認為科大訊飛是做語音做得非常好,實際上我們一直是在智能語音和人工智能這個方向上進行探索。因為我們用的深度神經網絡的算法,不僅僅是在語音識別、合成等等領域進行突破,還在圖像識別理解上不斷進行突破,還有機器的閱讀理解。

值得一看的是SQuAD大賽,曾經微軟說過誰能夠掌握在自然語言理解能力上的突破,誰就可以未來在人工智能上掌握先機。在斯坦福舉辦的SQuAD大賽中間,我們看到臉書、谷歌、微軟、IBM等非常多的單位都參加,是將十萬篇的英文給機器去理解、閱讀,由人來出題目,機器來回答,我們首次是代表亞洲進行參賽,就拿到了全球第一,而且刷新和改寫了這樣一個世界紀錄。

我們再看到像Cityscapes這樣一個比賽是由奔馳汽車廠家舉行的,實際上是來探索我們在自動駕駛領域的圖像的識別和理解技術。有44個單位參加,包括谷歌在內。我們也依然拿了全球第一。

越來越多的這樣的在人工智能領域方向上的突破,給我們帶來非常強的無限的可能。

今天我們說訊飛是一家登山型的企業,因為我們一直是用了最笨的辦法,始終是堅持,19年一直做這樣一個事情。上世紀我們慶峰董事長非常心懷夢想,帶著很多科大畢業優秀的高材生,天姿驕子一起去做一個事情,就是要將中文語音市場掌握在中國人手裡,並且做到全球最好,而今天,我們實現了,我們已經看到了非常非常多的未來。1999年創立以后,包括我們2000年成立這樣的產業化基地,到2008年順利上市,2009年我們佔領了整個中文語音市場70%的份額。今天也是非常非常多的機會呈現在我們面前。在人工智能第三次浪潮到來的時候,其實我們是需要去思考的,這一次人工智能浪潮的復興究竟能夠走多遠,能夠走得多大,我想其實就是和人工智能發展的核心三個要素有關系。

一方面是我們剛才看到的核心的能力、核心算法,這是我們的核心。第二就是行業大數據的累積,其實中國今天面臨著非常好的創新創業的氛圍,而且移動互聯網的發展,帶來了非常多的大數據,在這裡聚集。而且尤其還有我們第三個核心要素就是我們的行業專家。我們在和媒體談融合的時候,人民日報社的各位領導、老師就是我們的行業專家,要參與進來,和我們一起定標准。所以,我們今天看到人工智能發展,就需要去將大家一起凝聚起來。

我們看到人工智能如果未來和社會生產、生活的方方面面發生關系,主要是看會改變哪兩個方向?一方面是現在萬物互聯的背景下,人機交互,我們認為語音是個非常自然的方式。它就像人和人一樣,人和機器未來會用語音進行一種溝通。第二,人工智能的特點,就是我們的人工智能可以學習最優秀的人類的能力,並且可以輕鬆地超越90%的普通人。我們要將這種能力把它好好用起來,其實就是非常有價值的工作了。

我們在人工智能產業化應用上也是會著重從不僅僅給個人賦能,還要給行業賦能來進行。剛才北外的彭校長提到希臘語,我們的希臘語也在33種語言內,我們可以用它進行比較日常的交互,而且也希望能夠幫助大家去拓展更多的領域。在個人上,我們也希望可以真的推薦大家用一下訊飛輸入法,因為今天已經是有6億的用戶,它的准確率高達98%,我相信您用完以后基本上是離不開了,而且還有22種方言,包括說中文可以很快地翻譯成英文和大家交流。還有靈犀,是人和機器對話交流的窗口,可以調用后台非常多的的能力和你進行互動。

我們看看行業領域上的一些應用。首先我們在教育領域,其實教育領域是我們非常非常重視的一個戰略方向。今天我們在整個教學考評管的各個領域都推出了相應的產品,我們在打造整個中國智慧教育的第一品牌。我們今天推出來的人工智能的一些方法,可以在后台將我們的學生的大數據,通過我們的方法進行學習和判斷,給每個學生提供個性化的服務,讓我們孩子每個人接收到的信息是根據他學習的知識圖譜來進行定制的。這樣會使得我們學生的學習時間大為減少,以及提高老師的各種效率。中國說了這麼多年的因材施教的夢想,我們希望用我們的技術能給他們帶來一些幫助。

像在醫療領域,首先大家能想到的,我們在牙科醫生給您治療的時候,或者B超的醫生給您做腹腔檢查的時候,他的兩個雙手都在忙碌著,如果他帶了我們這樣一個定時麥克風的耳機,通過說就可以把他說的話進行診斷的語言用結構化的方式記錄下來,自動生成一個病例。實際上這是可以大大節約一線醫生的時間的。

同時,我們的家庭醫生的助手,像中國很多慢病,比如高血壓、糖尿病,是需要醫生實時進行關注和關心,我們這樣的后台醫生助手就可以為大家提供這種服務,還可以通過我們的語音機器人自動跟您去溝通,然后來觀察和關心詢問你的病情情況。

還有人工智能的輔助診療平台,在這個平台上,因為得益於去年8月份參加醫療影像識別大賽,我們拿了第一,我們不斷刷新,像TB肺結節這樣的病歷,我們達到94.1%的准確率。這個准確率實際上已經接近了三甲醫生診斷的水平。這樣一些能力能為我們的醫生提供一個輔助的診斷,在今天,在中國,我們已經有很多醫院採用了這樣一個醫療問診平台,為醫生提供更多的輔助的診療手段。

我們再看車載領域。2015年我們和美國NUANCE進行一場比賽,寶馬在選擇它的伙伴的時候,后來車速進行到100公裡,車窗打開,而且空調聲、各種噪聲的環境下,真正能夠達到可用門檻的語音交互能力隻有科大訊飛一家。我們也看到,今天我們不僅僅是和寶馬、奔馳、雷克薩斯等等非常多的30多家廠商和100多款車型進行了合作,未來我們相信汽車會是我們娛樂和工作、生活非常輕鬆的平台,語音在這種場景下就是一個剛需,能夠幫到大家更安全地進行駕駛。

再看客服。為了提高它的能力,我們在客服領域用我們的機器人進行回答,可以幫助人工座席進行分流,我們為運營商、銀行系統的客服進行服務,基本上代替了30%的人工,現在語音交互的能力讓你感到越來越親切。比如大家現在打電話給海底撈,跟你聊了半天的機器人小美,你不注意你都不知道它是一個機器人,它可以快速為你訂餐、服務,這實現了你和客戶之間的交流。

今天非常多的媒體朋友在這兒,在A.I.+媒體領域做了很多的探索,我們的技術實際上是希望它能夠在採、編、播、審、存各個環節得到運用。比如採訪領域,記者在前線寫看到了很多情況,他自己要寫下來,或者他採訪我們著名的巴曙鬆教授,他其實就可以用我們的設備,把他的語音轉成文字,不需要他一點一滴地去打,然后在編的環節,我們很多的音視頻的資料,如果用我們的系統去轉寫一個小時的音視頻5分鐘就可以轉寫出來了,播的領域也會帶來很多想象的空間,我們的機器人可以合成各種各樣的聲音。比如說前段時間,我們在中央電視台做了一個嘗試,大家知道著名的播音員李易老師的聲音是非常親切,但是他已經去世了,我們用他的聲音合成以后,講解了《創新中國》,在央視首映禮上,他的學生,他的很多非常關注的人,非常感動,看到了聲音又回到了他的身邊。而且兩會前還推出了和南方財經頻道推出了虛擬主持人,用他們最著名的主播合成了一個機器人,可以替他去播股市新聞、財經新聞等等,非常非常多的應用場景就會出現了。

審核和保存和管理這樣的環節上,我們的音視頻中間的資料的審核通過機器會比人看得又快又准。

我們再看A.I.會給我們的生活帶來什麼樣的變化。還是核心的語音交互的能力。現在市面上大家見到的機器人,如果是人機交互的方式,實際上70%多都是使用了科大訊飛后台給它的各種能力。包括在我們的客廳,在家庭裡面通過這樣的魔飛麥克風,可以通過它控制空調、冰箱等等,非常非常多的方式可以用語音去實現了。

我們從2010年已經將這樣的語音雲平台,這樣的能力開放給了廣大的開發者,開發者聚集越多,今天我們看到是一個非常好的形式,比如說在今天已經有89萬的創業團隊在上面凝聚了,而且覆蓋的終端也達到了非常多的數據。我們也看到,它每一天給我們帶來的日均使用次數是高達47億人次。A.I.新的時代,我們不僅僅是給科學家去成就,讓他希望用我們的算法和他的核心熟悉的領域相結合,同時我們也是希望給我們開發者賦能,也希望越來越多的人參與到這樣一個時代。我們說A.I.+的時代,不僅僅是從業者的時代,更是我們在座每一個人的新時代。同樣今天我們通過開場篇也想和大家傳達我們的價值觀,今天比人類更強大的不是A.I.,而是屬於掌握了A.I.的人類。我們每一個人掌握了A.I.,會使自己更強大,我們的人機耦合的方式會給我們的生活和生產帶來新變化。謝謝大家。

(責編:仝宗莉、朱一梵)

分享讓更多人看到

返回頂部