獵豹轉(zhuǎn)型:主攻“智能機(jī)器人”
獵豹移動聯(lián)合旗下人工智能公司獵戶星空,昨晚在北京水立方舉行“3.21機(jī)器人之夜”發(fā)布會,發(fā)布自主研發(fā)的獵戶機(jī)器人平臺Orion OS,并推出五款全系列機(jī)器人產(chǎn)品:接待機(jī)器人豹小秘、零售機(jī)器人豹小販、兒童陪伴機(jī)器人豹豹龍、小豹AI音箱和無人值守的咖啡店豹咖啡。
作者:牟云飛
來源:金融之家
獵豹移動聯(lián)合旗下人工智能公司獵戶星空,昨晚在北京水立方舉行“3.21機(jī)器人之夜”發(fā)布會,發(fā)布自主研發(fā)的獵戶機(jī)器人平臺Orion OS,并推出五款全系列機(jī)器人產(chǎn)品:接待機(jī)器人豹小秘、零售機(jī)器人豹小販、兒童陪伴機(jī)器人豹豹龍、小豹AI音箱和無人值守的咖啡店豹咖啡。
這也是傅盛接替任雷軍任獵豹董事長后的首次亮相。
獵豹移動3月15日曾公告,公司CEO傅盛將接替雷軍出任董事長。獵豹原董事長、董事雷軍向董事會遞交辭呈,不再擔(dān)任董事長和董事職務(wù),但是將繼續(xù)擔(dān)任獵豹移動的顧問。
雷軍此前同時擔(dān)任金山董事局主席,調(diào)整后,金山系和騰訊系管理團(tuán)隊或?qū)⒌霁C豹管理。金山軟件和騰訊集團(tuán)將其部分投票權(quán)轉(zhuǎn)移至傅盛。目前,傅盛及團(tuán)隊在獵豹中的表決權(quán)為45%。
履新后的傅盛,決定實現(xiàn)他的人工智能機(jī)器人夢。
他借用了馬斯克做火箭公司SpaceX的故事,并在水立方跳水來表決心:永不放棄。他以當(dāng)下最火的機(jī)器人嬌嬌和索菲亞為例,一度被外界認(rèn)為全世界沒有一家公司能做到真正的對話水平。
"在各大電視臺頻繁表演的所謂的人工智能機(jī)器人,它可以很機(jī)智的回復(fù)。但事實上,它是由后臺的一個真人來配音的,大家聽到的聲音類似于手機(jī)上的變音軟件,配音的人通過攝像頭坐在遠(yuǎn)程監(jiān)控室里,裝扮成機(jī)器人。
要想模仿人類,有手有腳,能走會說,這樣的機(jī)器人是很難完成的任務(wù)。傅盛說,人類太復(fù)雜,是進(jìn)化了幾億年的完美“產(chǎn)品”,雖然能單點被超越,但從整體系統(tǒng)上,想模仿都很難。現(xiàn)在的機(jī)器人行業(yè),技術(shù)還處于極早期,造價又昂貴,很難被用戶所接納。
為了機(jī)器人之夜,傅盛特意拉來朋友圈好友站臺,有小米聯(lián)合創(chuàng)始人王川、經(jīng)緯中國創(chuàng)始管理合伙人張穎、58同城網(wǎng)CEO姚勁波、紫牛基金創(chuàng)始合伙人張泉靈、錘子科技CEO羅永浩等“大咖”前來助陣。
在發(fā)布會現(xiàn)場,傅盛表示,我們?yōu)榻裉斓陌l(fā)布會準(zhǔn)備了好久。我從股東騰訊視頻上找到的一段視頻,一個在各大電視臺頻繁表演的所謂的人工智能機(jī)器人。
做一個機(jī)器人比我們想象的都難,很多從業(yè)者說:“傅盛,你做機(jī)器人是不是異想天開?你只做過互聯(lián)網(wǎng)軟件,你沒有做過硬件,你又不是人工智能博士出生,你憑什么做機(jī)器人?”
我的導(dǎo)師雷軍說過:人因夢想而偉大。他非常支持我這次在機(jī)器人上的豪賭,雖然他今天因為在香港開董事會沒有辦法來到現(xiàn)場,但也委派了小米的合伙人王川一起跟我見證這個時刻。
我們是何其幸運(yùn)的一代,互聯(lián)網(wǎng)就是全人類的頭腦風(fēng)暴。如果沒有互聯(lián)網(wǎng),我很難想象我在江西景德鎮(zhèn)這么一個小城市生活了17年,我有機(jī)會站在全球的舞臺上和大家一起討論高科技、機(jī)器人。
我一直問自己:即使今天全球已經(jīng)有6億用戶每個月在使用著獵豹移動的APP,我們在全世界已是最大的安卓工具軟件開發(fā)商。我們的游戲在全球有11億下載量,其中大多數(shù)為青少年。
但是做一個機(jī)器人非常難,它是跨越行業(yè),有的行業(yè)甚至不夠了解,比如機(jī)械制造、人工智能。但是這也正是我的機(jī)會,因為還有體驗和互聯(lián)網(wǎng)應(yīng)用是我和獵豹花了很長時間去積累的,我自己從一個很小的產(chǎn)品經(jīng)理開始,一點一滴地打磨用戶體驗,我成為了今天中國最大的安全軟件最早期的貢獻(xiàn)者,讓它成為了從國內(nèi)沖到海外,乃至全球的工具軟件。
機(jī)器人本質(zhì)上是通過用戶思維和產(chǎn)品思維結(jié)合今天的人工智能,和中國最有優(yōu)勢的機(jī)械制造的一個跨界行業(yè),雖然不一定我能做成,但是我真的覺得還是有機(jī)會。
為了讓我們的機(jī)器人往前沖,我們單獨(dú)成立了一家公司,叫獵戶星空。在冬天抬頭看著滿天的星斗,最大、最明亮的一個星座就是獵戶座。人類發(fā)往火星的第一艘載人飛船的名稱也叫獵戶號,我是如此鐘愛這個名字,于是就把我們最鐘愛的產(chǎn)品放在這家公司,親力打造。
這個是波士頓動力的機(jī)器人,可以做漂亮的后空翻,還有日本的ASIMO(日本本田機(jī)器人),我到現(xiàn)場看過它的表演。其實,波士頓動力被Google公司都賣掉了,我和相關(guān)的人去討論這個問題,得出結(jié)論:今天的機(jī)械控制還是一個非常復(fù)雜的系統(tǒng)工程,技術(shù)進(jìn)步也非常緩慢。
我通過各種渠道知道,這些動力基本上半個小時就得去充電。比如說日本ASIMO機(jī)器人,已經(jīng)研制了30年,至今不能走向家用,據(jù)說成本高達(dá)80萬美金。
今天我們看到的所有機(jī)器人,表情很有特點,造價很高,就像一個錄音機(jī)一樣,錄一句、說一句、回答一句,這并不是人工智能。為什么會這樣?為了弄清楚這個問題,我專門去過兩次日本,并把這款機(jī)器人的團(tuán)隊中很多人都見了一遍。
孫正義當(dāng)年花了很多心血,想做成的一款機(jī)器人,叫pepper,這款機(jī)器人被日本首相帶去了G7峰會,作為日本國力的一種展示。
當(dāng)我們要做一件事情的時候,你的整個人體的協(xié)調(diào)系統(tǒng),會用你沒有想到的方式,在高速運(yùn)轉(zhuǎn)。你的耳和眼要去探聽外界的環(huán)境,你的嘴要去進(jìn)行詢問、挖掘更多的信息,你的腦要進(jìn)行快速的決策和學(xué)習(xí),最后再通過肌肉系統(tǒng)去完成那個動作。
我舉一個小例子。比如說讓AI機(jī)器人執(zhí)行這句話:“服務(wù)員,幫我倒一杯紅酒。”現(xiàn)在全世界沒有一家公司能讓一個AI機(jī)器人做到說完句話紅酒就來了,除非那種固定軌道類型的機(jī)械,我們強(qiáng)調(diào)的是AI機(jī)器人。
聽覺:人的耳朵是一個非常了不起的感受器官,可以在嘈雜的環(huán)境中,聽到一個人說話,便立刻只識別他的聲音,不聽別人的無效聲音;在你低頭玩手機(jī)的時候,別人跟你說什么,你完全聽不見,在你想要聽到一些話語的時候,可以排除很多噪音去找到那個核心點。
今天沒有一個麥克風(fēng)能超越這個感受器官,在噪聲環(huán)境中聽到“幫我倒一杯紅酒”既能知道是對我說的,又能把語義給理解了。
使得機(jī)器人看你一眼就知道你在哪里、是什么樣子,也非常難。為什么呢?因為可能在昏黃的燈光下,你可能只給它一個側(cè)臉,或各種其他復(fù)雜情況。
視覺:一個AI產(chǎn)品的攝像頭有多好,都是在特定的光照下;人臉識別,AI超越了人,也是在特定的環(huán)境下,比如說特定的光照、特定的照片形式,或者限定在白天。
而人眼,即便是在晚上,只點一根蠟燭也能夠清晰地認(rèn)出你,沒有噪點(將光線作為接收信號并輸出的過程中所產(chǎn)生的圖像中的粗糙部分,也指圖像中不該出現(xiàn)的外來像素,通常由電子干擾產(chǎn)生),人的眼睛有5億像素,今天你買到最好的手機(jī)也就2000萬像素。
很多人在談?wù)撊斯ぶ悄苋〈耍绻苏娴氖巧系蹌?chuàng)造的,那上帝就是一個不可超越的產(chǎn)品經(jīng)理。
今天大家都稱手機(jī)為智能手機(jī),但是和機(jī)器人相比,它并不智能。手機(jī)執(zhí)行每一個指令必須要人去點擊它,而機(jī)器人應(yīng)該是站在那里,當(dāng)環(huán)境發(fā)生變化的時候,它主動來做一些事情,你就會發(fā)現(xiàn)AI的傳感器、語言、腦、計算能力、深度學(xué)習(xí)都與人類有相當(dāng)大的距離。
人工智能還很年幼,如果我們要使用人工智能技術(shù)去做一件很小的事情,比如學(xué)一句話、認(rèn)一個人臉,我們設(shè)計出品了小豹、小雅(都是AI音響),我們動用了大量人力去標(biāo)注數(shù)據(jù),讓機(jī)器去學(xué)習(xí)。今天整個AI產(chǎn)業(yè)處在非常早期階段,整個行業(yè)里,找不到一款真正有用的機(jī)器人的現(xiàn)狀。
我跟機(jī)器人領(lǐng)域的很多從業(yè)者溝通的時候,大家都特別有熱情。人是一個近乎完美的產(chǎn)品,但是我們并不需要一個近乎完美的產(chǎn)品,我們可以找到我們真正需要的產(chǎn)品。
人是這么難以超越。第一,我們的產(chǎn)品并不一定像人,今天在市面上不管是日本的pepper機(jī)器人,還是所有在機(jī)場看到的永遠(yuǎn)不開機(jī)的機(jī)器人,或者在某些專賣店里看的,它一定要找一雙手,我覺得手很有用,手的關(guān)節(jié)是非常多的,成本也非常高。
第二,通用機(jī)器人非常難,我們能不能做出一款在特定場景真的有用的機(jī)器人呢?如果讓用戶真的覺得它對我有點價值,能不能從一個小眾的、邊緣的市場切入,去找到這樣的用戶需求呢?
第三,由于產(chǎn)業(yè)尚在早期,為了做到真有用,就得下笨功夫,去打造每一個細(xì)節(jié)。比如說語音喚醒技術(shù),今天市面上有各種各樣的開放平臺,它并不像一些開放平臺已有10年時間了,他們也剛剛開始,所以它能滿足你的需求是非常少的。
今天整個機(jī)器人行業(yè)就是得把每一個細(xì)節(jié)做好。我去日本以后,討論了pepper機(jī)器人到底是怎么做出來的,我發(fā)現(xiàn)它的語音系統(tǒng)是采購了別人的;買了一家法國公司,把形體技術(shù)集成過來;視覺技術(shù)也不是自己做的。這導(dǎo)致了那個機(jī)器人在場景中、形式上很討巧,但5分鐘以后,就發(fā)現(xiàn)沒有什么用了。
今天全世界也沒有一家公司能夠做到人類真正的語義對話能力。所以,我們的目標(biāo)就是為真有用的機(jī)器人而生,不要去講什么像人和不像人,技術(shù)要怎么比,我們在像做手機(jī)一樣給用戶做一款他真正需要的產(chǎn)品。我們從2年前開始,把每一個系統(tǒng)的細(xì)節(jié)的能力,都變成一項產(chǎn)品,對市場推出,和用戶見面。
獵豹移動五大機(jī)器人介紹:
產(chǎn)品一:豹小秘接待機(jī)器人
1.顯示器
我記得和羅永浩討論的時候,他說人的腦是沒有一個顯示器的,要是有一個顯示器的話,交流肯定更方便。所以我們實現(xiàn)你的愿望,在它腦門上加了一個顯示器。使得它既可以做表情,也可以表達(dá)信息,不需要像pepper一樣,在胸口加上一塊屏幕。
2.頭部可180°轉(zhuǎn)動
我不想向雷總致敬,說沒有設(shè)計是最好的設(shè)計。我們在每一個細(xì)節(jié)上是非常精心打磨的,我們做了一個能夠180度轉(zhuǎn)的云臺,腦袋可以前后轉(zhuǎn),可以隨時看著你,非常靈活地跟著你。
它從上到下全部都是感應(yīng)器,從腦袋上最開始有一個廣角攝像頭。前面、胸口加了一個立體攝像機(jī),脖子上加了6個麥克,在頭頂上加了2個麥克,底下是我們的導(dǎo)航平臺、激光雷達(dá),所有這些感知,都是能夠讓它在一個環(huán)境當(dāng)中,找到你、跟隨你、引領(lǐng)你,并且避開所有避障。
我們拆了很多機(jī)器人,傳感器最豐富、而且要協(xié)調(diào)運(yùn)行得好。為了這一整套傳播,我們也想過購買一套技術(shù),最后發(fā)現(xiàn)很難。我們自己做了人臉識別算法(其實是人臉+人體識別算法),它不僅能夠看到你的人臉,還會根據(jù)你人體的形狀進(jìn)行識別,當(dāng)你轉(zhuǎn)身的時候,他就知道。
人不是完全靠人臉去認(rèn)識人的,當(dāng)一個人走進(jìn)的時候,你看他的形體、樣子、步伐就能夠認(rèn)出他,你光靠人臉去找一個人,這件事情在現(xiàn)實場景當(dāng)中,失敗率會非常高。因此,我們?nèi)诤狭苏麄€人體識別的技術(shù)。
3.自主語音合成技術(shù)
我們自主研發(fā)了TTS語音合成,就是你在電腦里打出一段文字,電腦就把這段文字念出來,不是通過錄音完成的。我們和其他公司最大思路不同,就是花了大量的人力打磨聲音。
我們找到發(fā)音人以后,讓他一句句錄下來,讓電腦學(xué)習(xí),然后讓幾十人參與標(biāo)注,比如重音節(jié)、語氣昂揚(yáng)、疑問等等,花了一年的時間,打磨了自主語音合成技術(shù)。
4.導(dǎo)航系統(tǒng)
我們還做了導(dǎo)航系統(tǒng)。這個導(dǎo)航系統(tǒng)首先叫多傳感器融合。我們說人眼是非常牛的,一雙眼睛既解決看臉的問題,又能解決開車的問題,還能解決晚上找東西的問題,但今天傳感器做不到。
這就需要優(yōu)化算法,我們用激光傳感器、視覺傳感器、超聲波傳感器的融合,雖然離人眼還有很大差距。在沒有那么強(qiáng)的光照、沒有那么高速度的情況下,我們已是業(yè)內(nèi)最好的導(dǎo)航平臺之一了,成本比市面上很多產(chǎn)品成本要低。
一個激光傳感器裝在無人車上要幾十萬的成本,但我們成本大概是對方的十幾分之一,甚至幾十分之一,以這樣的價格實現(xiàn)了這些功能。
我們受邀參加了GTC日本機(jī)器人比賽,英偉達(dá)的黃仁勛看了我們產(chǎn)品后非常感興趣,要求我們在他們的展臺上去運(yùn)動。日本的公司,沒有哪一家能夠做出在場地上來回自主巡航的導(dǎo)航產(chǎn)品。
5.語義能力
什么是語義能力呢?比如“服務(wù)員請幫我倒一杯水”,當(dāng)機(jī)器人明白“倒一杯水”這個詞時,這就叫語義能力,這是世界級的難點。
我們的做法就是針對用戶問的最多的問題,去精細(xì)打磨。我們在合作伙伴的音箱類產(chǎn)品上,包括小雅,我們針對用戶的語言,比如“我想聽哪首歌”、“聽哪一個評書”,做了大量的優(yōu)化,讓機(jī)器去理解這里的語義。
今天談智能交流,我去了pepper后,跟首席產(chǎn)品經(jīng)理交談,他說日本pepper要做成一個情感陪護(hù)機(jī)器人時,我覺得這款機(jī)器人基本上沒有機(jī)會,只能把它做成一個真正接受你的指令,幫助你完成一些任務(wù),像一個搖控器、一個搜索引擎一樣,通過語音能夠做的非常好。
6.算力
我們在機(jī)器人里面放了三塊芯片(高通的821、英偉達(dá)的TX1、英偉達(dá)的TK1),我們的運(yùn)算能力達(dá)到了2T的Flops,相當(dāng)于3.5個iPhoneX的運(yùn)算能力,為什么?因為它要感知周圍的環(huán)境。
人腦是很了不起的,我們開車用一個非常小的能耗就完成對復(fù)雜環(huán)境的判斷,而在機(jī)器人身上要用很多芯片,還要優(yōu)化算法,才能讓它變得很流暢,要讓芯片間能夠銜接的非常好,我們還做了很多協(xié)調(diào)工作。
我們還往它肚子了加了很多電池,通過實測,它比手機(jī)還耐電,不需要充電樁,也不喊累,也不需要充電,頭部非常靈活,有很多很多的傳感器,這些是為了能夠很好的完成接待任務(wù)。
7.開箱即用
機(jī)器人該怎么開始一個任務(wù)呢?我們曾在市面上買了一臺新鮮出爐的15萬的機(jī)器人,打開后一群人圍著它,十幾分鐘不知道怎么用,后來我們就委派了一個工程師,花了一天時間,接上PC、下載軟件、學(xué)習(xí)教程。最后終于知道怎么用了。
有一個重要工作是建圖,建圖就是讓機(jī)器人知道這個環(huán)境是怎么回事的一個過程,我們把它做的像一個手機(jī)APP一樣,打開手機(jī)進(jìn)行前后左右操作,跟著它,帶它走一圈回來,它就可以為你工作了。
只要機(jī)器人視覺里面形成的一幅地圖,它就知道哪里有墻、有東西,再通過這樣的環(huán)境,它才會知道帶你去哪個會議室。
我們要定制任務(wù)的時候,把它做得非常簡單,只需在手機(jī)或是Pad上點擊,就可以給它制定一個又一個的任務(wù)。這些任務(wù)你不需要編寫代碼了,只要點一個加好,新建一個任務(wù),和建立一個PPT沒有什么區(qū)別。
我們要做一款有用又智能的機(jī)器人,跨界非常難,要融合很多技術(shù)。正是因為跨界,今天市面上機(jī)器人的價格非常貴,我們內(nèi)部討論了很久。想做到什么價格呢?我們用自動充電、五星級接待、麥克風(fēng)陣列是自己做的,內(nèi)部還用了汽車上用的Canbus總線,使得整個上下系統(tǒng)間的接觸非常好。我們決定用一個月2999的租金讓大家體驗這款豹小秘,日本pepper需要3年的鎖定期,我們一個月就可以開始起租體驗。
我們也和58同城首家合作機(jī)器人租賃頻道,可以到58同城上直接租賃豹小秘。除接待場景下的豹小秘外,豹小販、豹豹龍兩款更貼近日常生活。豹小販零售機(jī)器人是一款全自主移動零售機(jī)器人,堪稱“會行走的售賣機(jī)”。
豹小販可以通過識別系統(tǒng),在大型商場、圖書館和游樂場等復(fù)雜環(huán)境中主動尋找目標(biāo)顧客,投其所好進(jìn)行產(chǎn)品推銷。此前電子科技大學(xué)圖書館30天的實測,豹小販以3倍的銷售成績遠(yuǎn)高于傳統(tǒng)自動販賣機(jī)。
產(chǎn)品三:陪伴童年的豹豹龍(見上圖)
豹豹龍與我兒時“阿童木”的夢想有關(guān)。我希望每個人的身邊都有一個“阿童木”的陪伴,沿用獵戶機(jī)器人平臺的技術(shù),讓這一夢想走向現(xiàn)實。
豹豹龍是兒童陪伴場景下的機(jī)器人。產(chǎn)品具備可愛的外形和逼真的“真童聲”,可以做到24小時安全陪護(hù),危險實時提醒。
豹豹龍還與編程貓、VIPKID和家有學(xué)霸等全國領(lǐng)先的兒童教育平臺建立合作,擁有覆蓋0-12歲全年齡段的權(quán)威優(yōu)質(zhì)少兒課程,真正做到寓教于樂。豹豹龍售價為9999元,相當(dāng)于一部iPhone X的價格,就可以給孩子一個有陪伴的童年。
產(chǎn)品四:小豹AI音箱盲測NO.1。
獵豹移動的音箱更看重的是音質(zhì)。內(nèi)置5個揚(yáng)聲器,高于行業(yè)2個的配置標(biāo)準(zhǔn),且單個揚(yáng)聲器成本是友商的5倍,這奠定了小豹AI音箱的硬件基礎(chǔ)。在此前的百人音質(zhì)聽感盲測中,小豹AI音箱以絕對優(yōu)勢奪魁。小豹AI音箱現(xiàn)已開啟搶先預(yù)定,售價499元。
小豹AI音箱現(xiàn)已經(jīng)接入QQ音樂1700萬的行業(yè)內(nèi)最全音樂曲庫,此外包括喜馬拉雅、樊登讀書會、騰訊新聞、蜻蜓FM等1億+有聲內(nèi)容源,同時設(shè)有包含張怡筠情商教育、凱叔講故事等在內(nèi)的行業(yè)最全的400W+兒童內(nèi)容。
小豹AI音箱是國內(nèi)首款融合區(qū)塊鏈技術(shù)的智能音箱,推出“智能鏈”。用戶可以通過購買和使用小豹AI音箱,加入到“智能鏈”中,一方面享受小豹AI音箱的個性化人工智能服務(wù);也讓每個人幫助AI進(jìn)化獲取AI積分,深度的參與到人工智能建設(shè)中。
獵豹還將獵戶語音OS開放給眾多合作伙伴,包括小米、喜馬拉雅、美的、富士康在內(nèi)的多家公司都基于獵戶語音OS,推出了智能音箱。
風(fēng)險提示:
本網(wǎng)站內(nèi)用戶發(fā)表的所有信息(包括但不限于文字、視頻、音頻、數(shù)據(jù)及圖表)僅代表個人觀點,僅供參考,與本網(wǎng)站立場無關(guān),不構(gòu)成任何投資建議,市場有風(fēng)險,選擇需謹(jǐn)慎,據(jù)此操作風(fēng)險自擔(dān)。
版權(quán)聲明:
此文為原作者或媒體授權(quán)發(fā)表于野馬財經(jīng)網(wǎng),且已標(biāo)注作者及來源。如需轉(zhuǎn)載,請聯(lián)系原作者或媒體獲取授權(quán)。
本網(wǎng)站轉(zhuǎn)載的屬于第三方的信息,并不代表本網(wǎng)站觀點及對其真實性負(fù)責(zé)。如其他媒體、網(wǎng)站或個人擅自轉(zhuǎn)載使用,請自負(fù)相關(guān)法律責(zé)任。如對本文內(nèi)容有異議,請聯(lián)系:contact@yemamedia.com