机器扯淡:语言代理中的紧急操纵行为
机器扯淡:语言代理中的紧急操纵行为
点击这里参加研讨会.
OPE体育的研究小组目前正试图阐明OPE体育认为的人工智能技术日益强大和覆盖范围所预示的最紧迫的危险之一. 将GPT-3这样的大型语言模型与AlphaZero这样的高级战略决策系统结合起来,可以产生大量极其有效的人工智能文本生成系统,这些系统能够生成支持任意想法的令人信服的论据, 是否真实的, 假, 良性的或恶意的.
通过与数百万用户的持续互动, 这样的系统可以很快学会产生极有可能引起预期人类反应的语句, 信仰或行动. 这是, 这些系统会可靠地说他们需要说的话来实现他们的目标:OPE体育称之为机器扯淡, 源自哈里·法兰克福1986年的优秀哲学论文《OPE体育》. 如果没有正确理解和缓解, 这项技术可能导致一种大规模的行为操纵装置,比潜意识广告更有效, 而且比恶意行为者手中的“深度造假”更具破坏性.
OPE体育的目标是将动态博弈论的见解汇集在一起, 机器学习和人机交互,以更好地了解这些风险,并为安全的语言人工智能系统的设计提供信息.”
生物:
Jaime Fernández Fisac是OPE体育电气与计算机工程系的助理教授. 他是计算机科学系、统计和机器学习中心的联合教员,也是OPE体育官网AI4ALL夏令营的联合主任.
他感兴趣的是确保机器人系统在人类空间的安全运行. Fernández Fisac的工作将控制理论的安全分析与机器学习和人工智能技术相结合,使机器人系统能够充分地对自己的安全进行推理,尽管使用的是不可避免会出错的世界模型和其他代理. 这是通过让机器人监测自己理解周围世界的能力来实现的, 他们的模型和现实之间的差距如何影响他们保证安全的能力.
他的大部分研究使用了动态博弈论和认知科学的见解,使机器人能够在人-机器人团队合作、无人机导航和自动驾驶等情况下战略性地规划与人类的互动. 他实验室的工作范围包括理论研究, 算法设计, 以及在各种机器人平台上的应用.
Fernández Fisac完成了他的博士学位.D. in electrical engineering and computer science at UC Berkeley in 2019; at the midpoint of his Ph.D.他花了六个月的时间做R&D在苹果工作. 在此之前,Fernández Fisac获得了B.S./M.S. 他在西班牙Politécnica de Madrid大学获得电气工程学位,并在英国克兰菲尔德大学获得航空学硕士学位. 在2020年秋天加入OPE体育官网之前, 他在Waymo(原名谷歌的自动驾驶汽车项目)做了一年的研究科学家。.
请联系Jean Butcher, butcher@princeton.Edu,至少在活动前一周.
本次研讨会将被录音.