超參數(shù)科技,首次對外發(fā)布其在游戲領(lǐng)域的進(jìn)展。在西山居研發(fā)中的吃雞類游戲《榮耀之!防,由超參數(shù)科技和西山居合作的3D生存類AI“獵戶座α”,通過從零開始的
超參數(shù)科技成立于2019年初,由原騰訊AI Lab總經(jīng)理、T4技術(shù)專家劉永升創(chuàng)立,已獲得晨興資本、高榕資本投資的A輪融資。團(tuán)隊成員包括來自騰訊AI Lab和IEG游戲的多位人工智能科學(xué)家、技術(shù)骨干,以及海內(nèi)外頂尖院校的精英伙伴。在騰訊期間,劉永升與核心團(tuán)隊主導(dǎo)了圍棋AI“絕藝”、王者榮耀AI“絕悟”的研發(fā)工作。
成立以來,超參數(shù)科技主攻深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、大系統(tǒng)工程等技術(shù)領(lǐng)域。通過將AI能力和游戲場景進(jìn)行深度結(jié)合,為******類、休閑類、角色扮演類、開放生存類等不同品類的游戲公司提供人工智能解決方案,幫助游戲廠商提升開發(fā)效率、開啟全新玩法,在游戲設(shè)計、開發(fā)、運(yùn)營等多個環(huán)節(jié)創(chuàng)造價值。
近年來,游戲AI不斷發(fā)展,星際、Dota2、德州撲克、麻將相繼被AI攻克,但仍存在兩大問題——即環(huán)境的復(fù)雜度問題和AI的擬人度問題。
基于上述兩點,超參數(shù)科技判斷,具有復(fù)雜3D環(huán)境、要求多人在線D生存類游戲?qū)⒊蔀锳I的下一大挑戰(zhàn)。在西山居研發(fā)中的新游戲《榮耀之!防,超參數(shù)科技訓(xùn)練了名為“獵戶座α”的AI智能體。目前,“獵戶座α”已經(jīng)具備了復(fù)雜3D環(huán)境感知、物資搜索/使用、作戰(zhàn)、團(tuán)隊配合等全方位的能力。
據(jù)悉,“獵戶座α”采用了深度強(qiáng)化學(xué)習(xí)方法,從零開始,通過與環(huán)境的交互和試錯,學(xué)會觀察世界、執(zhí)行動作、合作與競爭策略。AI沒有使用任何人類玩家的對戰(zhàn)數(shù)據(jù),完全基于自我對戰(zhàn)(self-play)的方式進(jìn)行學(xué)習(xí)。
目前,“獵戶座α”從零開始逐漸學(xué)會了在3D環(huán)境中生存所需的全方位能力,包括復(fù)雜3D環(huán)境感知、物資搜索/使用、作戰(zhàn)、團(tuán)隊配合等能力,展現(xiàn)出廣闊的應(yīng)用前景。
在AI的訓(xùn)練過程中,團(tuán)隊還觀測到了許多與人類生存進(jìn)化過程相似的地方。人類在進(jìn)化過程中,先學(xué)會采集食物補(bǔ)充能量、應(yīng)對惡劣天氣,然后學(xué)會各種工具的使用,掌握記憶等高級認(rèn)知能力,進(jìn)而學(xué)會與族群內(nèi)同伴分工合作、與其他族群競爭對抗。AI通過多智能體的自我訓(xùn)練的方式,也表現(xiàn)出了類似的進(jìn)化現(xiàn)象。隨著訓(xùn)練局?jǐn)?shù)的增加,AI逐漸涌現(xiàn)出了物資搜集、物資使用、空間感知、認(rèn)知能力和復(fù)雜策略等智能行為。
超參數(shù)科技表示:“我們有理由相信,AI智能體在其中學(xué)到的能力,包括3D環(huán)境感知與理解、對復(fù)雜環(huán)境變化的適應(yīng)、對不確定性的評估與推理、對各種戰(zhàn)略戰(zhàn)術(shù)的靈活應(yīng)用,以及多智能體間的競爭與合作等,一定能從虛擬反哺現(xiàn)實,在無人駕駛、智慧城市、醫(yī)療等更廣泛的領(lǐng)域帶來價值。”