前段時間,名為“Figure 01”的機器人因會沖咖啡而走紅。這兩天,它還找到了新工作,要去寶馬的美國工廠“實習”,干得好的話,一兩年后就能到流水線上參與“造車”了。
Figure 01是創(chuàng)業(yè)公司Figure的大作,該公司僅成立一年,主營開發(fā)和制造人形機器人,估值已經(jīng)超過4億美元。最近,F(xiàn)igure與知名車企寶馬達成重要協(xié)議,將在今年晚些時候將Figure 01機器人引入到南卡羅來納州斯巴達堡的寶馬工廠。
斯坦福的機器人能炒蝦,特斯拉的擎天柱機器人能在人類的操縱下做家務,而Figure 01的特別之處在于超強的自主學習能力,它能看著視頻學會操作技能,這意味著,它的技能會在學習中變得越來越豐富。
如果2023年的科技前沿是ChatGPT引領的人工智能自然語言大模型,那么2024年的前沿很可能是AI模型加持下的機器人,各種具備服務人類能力的機器人將不斷涌現(xiàn),它們不再是狗、蛇、屬這些仿動物形態(tài),而是直接仿人造型,協(xié)助甚至替代人類執(zhí)行體力勞動。
Figure 01看個視頻就掌握了技能
剛剛進入2024年,各家身懷絕技的人形機器人一個接一個的冒了出來。前有斯坦福炒蝦機器人,后有特斯拉的疊衣機器人,最近,會沖咖啡的機器人Figure 01也來了。
打開機蓋、放入咖啡包、按下開始按鈕,F(xiàn)igure 01一整套動作十分流暢。與其他機器人做家務的視頻不同,F(xiàn)igure 01沖咖啡的視頻并沒有做加速處理。
當然,F(xiàn)igure 01還遠不如鋼鐵俠的“賈維斯”那么厲害,但“小賈”畢竟只存在于電影里,而Figure 01已經(jīng)隨著人工智能的發(fā)展走進了現(xiàn)實。
它完全由AI驅動。別小看了這一點,因為有了AI后,要求Figure 01完成事務時已無需事先預設程序,AI為它注入了強大的學習能力。官方說法是,F(xiàn)igure 01只需要看一看人類示范的演示視頻,再加上10小時端到端的訓練,就能學會視頻里的操作技巧,然后完全自主地搞定任務。
沖咖啡只是證明Figure 01具備自學能力的第一步,開發(fā)公司Figure表示,只要給它足夠的時間,它還就能攻克更復雜的任務。復雜到什么程度呢?Figure公司直接用一單合作給出了答案。
今年1月18日,F(xiàn)igure表示,將會把這款機器人送入寶馬斯巴坦堡的工廠進行試點應用,主要替代人類從事一些危險度高的任務。
Figure與寶馬達成合作將Figure01引入汽車工廠
寶馬的斯巴坦堡工廠位于美國的南卡羅來納州,是寶馬X系列和Z系列的主要組裝工廠,BMW X6的車身制造就在這個工廠里用到了300多個機器人,其中,車窗玻璃安裝都是機器人在執(zhí)行操作,只有側窗玻璃由人工安裝,如此一來,加工時間縮短了一半以上。
而即將進寶馬工廠“上工”從事危險作業(yè)的Figure 01,身高5英尺6英寸,也就是1米67的個頭;可承重19.95公斤,差不多是飲水機用的一大桶桶裝水的重量;充電后,它可以運行5小時,行走速度為4.3公里/小時。
“通用目的機器人的潛力完全未被發(fā)掘?!盕igure的首席執(zhí)行官兼創(chuàng)始人布雷特·阿德科克表示, 他們的機器人能讓公司提高生產(chǎn)力、降低成本,并創(chuàng)造一個更安全、更一致的工作環(huán)境。
據(jù)悉,初期階段,F(xiàn)igure 01將從“少量工作”開始,隨著時間推移,這些由AI驅動的人形機器人將加入更多的制造工作,包括箱子搬運、拾取和放置任務、托盤裝載,以及汽車制造商一直難以留住人工工人的其他崗位。
如果達到目標,F(xiàn)igure 01的部署數(shù)量將會增加,預計需要12-24 個月的時間真正集成到寶馬的制造流程中,包括車身車間、鈑金和倉庫等工區(qū)。
一大批人形機器人已在路上
Figure 01不過是眾多人形機器人中的一款,2024年,更多的仿人機器人正在來的路上。
今年剛剛成立的中國公司MagicLab推出了運動型的純電動機器人,它已經(jīng)能完成后空翻落地、優(yōu)雅起身這樣的體操運動員動作了。
挪威的人形機器人初創(chuàng)企業(yè) 1X Technologies今年直接帶來了EVE 和 NEO 兩款產(chǎn)品。EVE已在美國和歐洲部分地區(qū)投入商業(yè)化應用,能巡邏,能搬運,能導航,能放哨,相當于機器人保安;而NEO目前仍處于研發(fā)階段,據(jù)稱,它會像人類一樣柔軟、輕巧,可以通過面部表情與人類溝通。
1X Technologies推出兩款人形機器人
機器人賽道的元老DeepMind當然不甘落后,持續(xù)在仿人機器的“大腦”層面做開發(fā),其有關機器人的三個關鍵研究AutoRT、SARA-RT和RT-Trajectory,將有效提高機器人的數(shù)據(jù)收集效率和泛化能力。
其中,AutoRT是機器人訓練系統(tǒng),能夠同時指導多臺機器人在不同環(huán)境中執(zhí)行多樣化任務;SARA-RT是提升機器人Transformer模型效率的系統(tǒng);RT-Trajectory則是實現(xiàn)機器人泛化能力的模型,能讓機器人從2D軌跡圖像中學習控制策略。
強調自身定位是“人工智能/機器人公司”的特斯拉,最近帶火的視頻是旗下人形機器人“擎天柱”疊衣服的畫面。視頻中,“擎天柱”站在桌子前,從盒子里取出一件黑色T恤,然后緩慢地將之疊好。
不過,這段視頻遭到質疑。有網(wǎng)友指出,馬斯克使用了CGI(三維動畫)技術偽造了視頻;還有人發(fā)現(xiàn)視頻里露出了機械臂,據(jù)此,網(wǎng)友稱這一系列疊衣動作可能并非完全由機器人自主完成,而是外部遙控操作的結果。
特斯拉機器人疊衣服視頻中出現(xiàn)機械臂
被“打臉”后,馬斯克也老老實實承認,“擎天柱”目前還不能自主執(zhí)行疊衣服操作,但“未來肯定行”。
如果單從技術性看,“擎天柱”還是有所進步,它新增了觸摸傳感器,對接觸對象的形狀、大小、位置和方向等信息能實現(xiàn)精準獲取和分析,尤其是對壓力有了更好的判斷,從而精準控制力度,比如,機器人用“手”拿起雞蛋也不會捏碎。
在自主執(zhí)行操作層面,其實大多數(shù)機器人都還做不到。
比如,前段時間在視頻平臺爆火的斯坦福家務機器人 Mobile ALOHA,它采用的是自動+遙控的學習模式,需要人類先操控機械臂為它打個樣,然后 Mobile ALOHA才能“照葫蘆畫瓢”學習類似的動作。
而且,不是只要演示過后Mobile ALOHA就能全部學會。根據(jù)論文,它學會擦紅酒漬的成功率為95% ,推椅子為80% ,炒蝦只有40%。此外,我們看它操作時也會發(fā)現(xiàn),視頻是倍速播放的,可以想象,在真實場景中,Mobile ALOHA做家務的速度一定十分緩慢。
到了Figure 01,自主學習能力在AI的加持下得到了提升。Figure公司稱,他們的機器人完全由AI驅動,能夠處理通用任務,并最終實現(xiàn)機器人與環(huán)境的學習和互動。據(jù)說,F(xiàn)igure 01沖咖啡就是通過觀看視頻后上手執(zhí)行的,并沒有人類遠程操作。
英偉達高級研究科學家Jim Fan曾預測,2024年將是“機器人年”,而從去年熱到今年的AI,將是人形機器人智能化的加速器。