银河网上娱乐场
  • |
  • 首页
  • |
  • 彩票论坛
  • |
  • 媒体预测
  • |
  • 彩票数据
  • |
  • 国际彩讯
  • |
  • 行业资讯
  • |
  • 中彩新闻
  • |
  • 彩票开奖
  • |
  • 高手合买
  • |
  • 竞技彩
  • |
  • 地方福彩
  • |
  • |  当前位置: 首页 >  国际彩讯  >  ag环亚最新官网平台|近5亿次捉迷藏游戏中,AI玩家策略轮番升级,花式使用工具

    ag环亚最新官网平台|近5亿次捉迷藏游戏中,AI玩家策略轮番升级,花式使用工具

    2020-01-11 09:11:45   
    摘要 :在最近发布的一篇论文中,openai揭示了这一试验的初步结果。在玩了数亿次捉迷藏游戏后,两个相互竞争的ai队伍设计出了复杂的游戏策略,其中不乏工具使用和相互协作。在数亿轮的游戏过程中,ai玩家制定了几种躲藏策略和搜寻策略。比赛逐渐复杂,ai玩家策略轮番升级但是在大约2500万轮游戏之后,比赛就变得更加复杂了。新型复杂智能的可能性研究人员认为,这些结果初步验证了这一创造复杂ai的新方法的可行性。

    ag环亚最新官网平台|近5亿次捉迷藏游戏中,AI玩家策略轮番升级,花式使用工具

    ag环亚最新官网平台,在生命的早期,生活很简单。它们是微小的单细胞生物,几乎没有协调性。然而,经过数十亿年的竞争和自然选择,这些简单的生命形式已经逐渐演变成我们今天拥有的复杂的生命形式和复杂的人类智能。

    总部位于旧金山的盈利人工智能实验室“开放人工智能”的研究人员现在正在测试这一假设:如果竞争可以在虚拟世界中模拟,那么更复杂的人工智能还能进化吗?

    最近,openai的实验代理逐渐获得了掌握复杂行为的能力,为更复杂的人工智能的发展指引了一条新的道路。

    该实验基于该领域现有的两种思想:多智能体学习,即通过竞争或协调各种算法生成紧急情报;以及强化学习,即在连续测试和纠错过程中学习和实现其目标的特定机器学习技术。

    深度思维(Deepmind)凭借其突破性的程序alphago,打败了围棋中最好的人类玩家,从而很好地推广了强化学习的概念。

    在最近发表的一篇论文中,openai揭示了这个实验的初步结果。在玩了数亿个捉迷藏游戏后,两个相互竞争的人工智能团队(探索者和隐藏者)设计了复杂的游戏策略,包括使用工具和相互合作。这项研究也是对openai领导的研究策略的深刻诠释:大大扩展现有的人工智能技术,看看是否有新的东西。

    论文链接:

    https://openai.com/blog/emergent-tool-use/

    报纸上有一段有趣的视频:

    https://www.youtube.com/embed/kopolzvh5jy

    在大约2500万轮捉迷藏游戏后,捉迷藏者学会了通过建造障碍物来阻挡他们的视线来赢得游戏。

    捉迷藏战略已经逐步升级。

    游戏的设计方式是,研究人员设计了一个虚拟环境,包括一个封闭的空间,里面有各种各样的物体,比如积木、坡道以及可移动和不可移动的障碍物。玩家自己由强化学习算法控制。在每场比赛中,玩家被分成两个队:藏起来的人只要没有被探索者发现就会得到奖励,而探索者会因为找不到藏起来的人而受到惩罚,反之亦然。当我们还是孩子的时候,我们经常玩捉迷藏,藏东西的人可以先玩几秒钟。此外,研究人员没有给玩家任何其他指示。

    在数亿轮游戏中,人工智能玩家已经开发了几种隐藏和搜索策略。在第一阶段,隐藏者和探索者的策略非常简单粗暴:他们只是在太空中四处移动。

    随着竞争变得越来越复杂,人工智能玩家的策略轮流升级。

    但是在大约2500万轮游戏之后,比赛变得更加复杂。隐藏者学会了在太空中移动盒子和路障,并在自己周围建造堡垒,这样探索者就永远看不见它们了。不仅如此,他们还制定了合作策略,例如互相转移物体以加快建造堡垒的进程。

    然而,在7500万回合中,探索者找到了对策,游戏进入了第三阶段。他们绕着藏物人的堡垒移动坡道,并用它穿过墙壁。到了第四阶段,经过1000万回合后,隐藏者已经学会在建造堡垒前将坡道锁定到位。(两个团队都不能解锁被另一个团队锁定的对象。)

    到了第三阶段,探索者已经学会使用坡道爬过堡垒的墙壁。

    起初,openai研究人员认为游戏已经结束。然而,在3.8亿轮之后,出现了两个新的战略。探索者利用锁定的坡道爬上解锁的箱子,然后冲向箱子顶部的藏人堡垒,轻松地穿过墙壁。在最后的六个阶段,躲藏的人也实施了对策:在建造堡垒之前锁定所有的坡道和箱子。

    最后,经过3.8亿轮训练,探索者学会了使用“箱式冲浪”穿越堡垒的墙壁。

    新复杂智能的可能性

    研究人员认为,这些结果初步验证了这种新方法创建复杂人工智能的可行性。该论文的作者之一鲍文·贝克(Bowen baker)说:“我们没有告诉人工智能玩家绕着盒子跑或与之互动,但是通过多智能体竞争,他们为彼此创造了新的任务,一个团队必须想出新的策略来击败另一个团队。”

    这项研究反映了openai独特的人工智能研究方法。虽然这个实验室和其他实验室一样,也投资于其他新技术的开发,但它仍因扩大现有技术的使用而广为人知。例如,实验室“臭名昭著”的语言模型gpt-2借鉴了早期语言模型(包括谷歌的bert)的大量算法设计。Openai的创新基于其工程设计和巨大的计算资源。

    澳门赌场

    延伸阅读
    焦点
    ·吉林省原副厅级国家工作人员裴占荣回国投案
    ·《黄金兄弟》剧情硬伤多,郑伊健陈小春勇闯夺命岛,堪比抗日神剧
    ·感情中你瞒我瞒,谁也得不到想要的
    ·武警北京总队执勤第四支队基层政工主官《纲要》集训,绝非“说一说”,而是“动真格”!
    ·苏群大胆建议萧华:更改赛制不如管好手下的嘴,重回中国市场
    ·国内医美培训现场心惊肉跳 血液器皿过期近9个月
    ·四川德阳:一所乡镇学校的开学季 这群志愿者连续十年赴约
    ·福建高校扩大对台招生规模
    ·北京肺癌暴增43%,精准治疗刻不容缓
    ·5个月订单量已超去年12倍,看京东拼购义乌商家如何玩转京东618
    推荐
    6.98万起,轴距将近2米8全系标配自动大灯的时尚MPV
    富源县税务局多措并举加强环保税征收管理
    吴尊参加《爸爸去哪儿5》?这年头帅哥都去当奶爸了!
    粤西首个大型海洋度假区吸引千人团前往
    二战时此国默不作声,使17万日军丧命,至今连尸首也找不见
    12月已有四地调整楼市政策 房价大涨或难卷土重来
    生完孩子后,产妇能去娘家坐月子吗?这里面的讲究,你要清楚!
    下周二起,途经王府井6条公交线路有调整
    世界读书日,用阅读感受卡西莫多的忧伤 | 睡前聊一会儿
    泰康保险副总裁刘挺军:泰康今年起加速布局养老社区
    热门关注
    ·四川威远地震灾区2.4万余户居民全部恢复供电
    ·奇异天体轴子星形成的过程:行为如同单个粒子
    ·老人走路腿酸胀、乏力,或是“腿梗”了
    ·珠海交警动用无人机严查打尖插队,一个半月查处近四千宗
    ·许家印牌友周大福看上ST景谷 在6年内5次易主
    ·经济日报:美国指责中国“经济侵略”缺乏常识
    ·伦敦银恐再迎大波动!今晚“恐怖数据”驾到
    ·俄特种部队在叙利亚表现活跃,埃及打算向其取经
    ·中国联通:今年建4万5G基站 和移动电信广电都谈合作
    ·昌乐鲁兹中德产业园项目奠基仪式举行
    © Copyright 2018-2019 roxicar.com 银河网上娱乐场 Inc. All Rights Reserved.