太康| 保定| 兴化| 台山| 宣城| 宾川| 顺义| 安仁| 乌拉特前旗| 格尔木| 江门| 安国| 曲沃| 揭东| 遂平| 朝天| 平和| 玉山| 荆门| 琼中| 松滋| 新龙| 潮阳| 二连浩特| 绵竹| 雷波| 昆明| 门源| 蛟河| 遵义市| 呼玛| 汉口| 丹阳| 安龙| 铜梁| 台江| 呼伦贝尔| 保靖| 南安| 荆州| 寿宁| 潮南| 临汾| 单县| 子洲| 万荣| 兴和| 枣强| 珠海| 余庆| 乌恰| 绥化| 七台河| 遂昌| 奎屯| 贵池| 义县| 巧家| 济宁| 万年| 盖州| 上虞| 措勤| 利辛| 汝州| 玉林| 保定| 沈丘| 平房| 曾母暗沙| 廉江| 高密| 枝江| 孝昌| 西宁| 马尾| 固安| 开远| 富蕴| 延川| 三原| 甘棠镇| 泽普| 拉孜| 桐梓| 灵武| 漳县| 浮山| 拉萨| 株洲县| 澎湖| 太谷| 腾冲| 土默特右旗| 桂东| 农安| 茂县| 芦山| 靖西| 黄陵| 钓鱼岛| 当涂| 中牟| 武当山| 武邑| 久治| 白银| 新密| 泸西| 宜川| 肥乡| 科尔沁左翼后旗| 自贡| 临潭| 沐川| 壤塘| 湘阴| 永丰| 宝丰| 赤水| 恩施| 扶绥| 德安| 谢家集| 易县| 永泰| 桃源| 海原| 安新| 双阳| 固始| 武强| 滑县| 淇县| 中山| 根河| 美溪| 沿滩| 大安| 阜宁| 蛟河| 宁南| 南丹| 南海镇| 通许| 乌当| 清水河| 藤县| 彭水| 君山| 潮州| 西昌| 桂阳| 张掖| 黎平| 株洲市| 神农顶| 黄骅| 嵊州| 永川| 茶陵| 马山| 兖州| 革吉| 江城| 普洱| 乌兰浩特| 甘德| 鄂温克族自治旗| 五寨| 潜山| 渠县| 康乐| 桦川| 蚌埠| 武汉| 建德| 阳西| 弥勒| 友谊| 哈巴河| 西峡| 个旧| 南海| 彰化| 科尔沁右翼前旗| 康定| 米易| 洮南| 新河| 安乡| 弓长岭| 顺义| 嵊州| 单县| 墨江| 康定| 合作| 仲巴| 宣汉| 平利| 鹤壁| 宜川| 岐山| 高淳| 夏县| 鄂温克族自治旗| 达拉特旗| 威宁| 定安| 库伦旗| 和林格尔| 万年| 正安| 噶尔| 会宁| 绩溪| 海伦| 勐腊| 美姑| 理县| 桦南| 博罗| 四方台| 双城| 汨罗| 衡阳县| 永善| 南漳| 长清| 洮南| 丹寨| 林口| 兴城| 安仁| 凤庆| 和政| 宁都| 邛崃| 石泉| 随州| 桃源| 融安| 明溪| 临潼| 调兵山| 福海| 应县| 平顶山| 六枝| 巴彦| 奇台| 宝安| 南召| 长沙| 连南| 五常| 巴里坤| 宁国| 潮阳| 阜平| 巴马| 武强| 平舆| 澳门葡京官网
 
 
当前位置:首页 > 养猪技术 > 综合养猪 > 正文

深度强化学习为人工智能系统注入“灵魂” 可让四足机器人自己学走路

   转载 发布时间:2019-02-21 11:45:39   来源:前瞻网   举报
【导读】人工智能(AI)系统使得机器人能够以人类灵巧的方式掌握和操纵物体,现在,研究人员表示他们已经开发出一种算法,通过这种算法,机器可以自己学会走路。在Arxiv.org上发表的一份预印本论文中(“通过深度强化学习来学习走路”),加州大学伯...
标签:开疆拓宇 威尼斯人注册 河北进步道

人工智能(AI)系统使得机器人能够以人类灵巧的方式掌握和操纵物体,现在,研究人员表示他们已经开发出一种算法,通过这种算法,机器可以自己学会走路。在Arxiv.org上发表的一份预印本论文中(“通过深度强化学习来学习走路”),加州大学伯克利分校的科学家和谷歌人工智能(AI)研究部门之一Google Brain描述了一种人工智能系统,教“一个四足机器人来穿越熟悉和不熟悉的地形。

“深度强化学习可以用于自动获取一系列机器人任务的控制器,从而实现将感知输入映射到低级别动作的策略的端到端学习。”该论文的作者解释道。 “如果我们可以直接在现实世界中从头开始学习运动步态,原则上我们就能获得最适合每个机器人、甚至适合单个地形的控制器,潜在地实现更好的敏捷性、能源效率和稳健性。”

设计挑战是双重的。强化学习是一种使用奖励或惩罚来驱动代替人实现目标的人工智能培训技术,它需要大量数据,在某些情况下需要数万个样本才能获得良好的结果。并且微调机器人系统的超参数 —— 即确定其结构的参数 —— 通常需要多次训练,这可能会随着时间的推移对腿式机器人造成伤害。

“深度强化学习已被广??泛用于模拟中的学习运动策略,甚至将它们转移到现实世界的机器人中,但由于模拟中的差异,这不可避免地导致性能损失,并且需要大量的手动建模。”该论文的作者指出,“在现实世界中使用这些算法已经证明具有挑战性。”

为了找到一种方法,用研究人员的话说,“(使)一个系统在没有模拟训练的情况下学习运动技能成为可能,他们选择了一种称为“最大熵RL”的强化学习框架(RL)。最大熵RL优化学习策略以最大化预期回报和预期熵,或者正在处理的数据中的随机性度量。在RL中,AI代理通过从策略中采样动作并接收奖励,不断寻找最佳的行动路径,也就是说,状态和行动的轨迹。最大熵RL激励政策更广泛地探索;一个参数 —— 比如说,温度 —— 确定熵对奖励的相对重要性,从而确定其随机性。

但这并不全是积极和有效的,至少不是一开始。因为熵和奖励之间的权衡直接受到奖励函数的规模的影响,而奖励函数的规模又影响学习速率,所以通常必须针对每个环境调整缩放因子。研究人员的解决方案是自动化温度和奖励规模调整,部分是在两个阶段之间交替进行:数据收集阶段和优化阶段。

结果不言自明。在OpenAI的健身房(一个用于训练和测试AI代理的开源模拟环境)进行的实验中,作者的模型在四个连续运动任务(HalfCheetah、Ant、Walker和Minitaur)中实现了“几乎相同”或比基线更好的性能。

在第二次真实世界的测试中,研究人员将他们的模型应用于四足Minitaur,这是一种带八个执行器的机器人,一个测量马达角度的马达编码器,以及一个测量方向和角速度的惯性测量单元(IMU)。

他们开发了一个管道,包括(1)计算机工作站,更新神经网络,从Minitaur下载数据,并上传最新策略;(2)在机器人上安装Nvidia Jetson TX2执行上述策略,收集数据,并通过以太网将数据上传到工作站。经过两个小时160,000步的训练后,通过奖励前进速度和惩罚“大角加速度”和俯仰角的算法,他们成功地训练Minitaur在平坦的地形上行走,越过木块等障碍物行走,以及爬上斜坡和台阶,而这些在训练时间内均未出现。

“据我们所知,这个实验是深度强化学习算法的第一例,这种算法可以在没有任何模拟或训练的情况下,直接在现实世界中学习欠驱动的四足运动。”研究人员写道。

免责申明:本栏目所发资料信息部分来自网络,仅供大家学习、交流。我们尊重原创作者和单位,支持正版。若本文侵犯了您的权益,请直接点击提交联系我们,立刻删除!
 
相关资讯
 
相关图文
 
图文热点
 

 

栏目推荐

人工智能的应用路径:“AI”还是“AI”?

深度强化学习为人工智能系统注入“灵魂” 可让四足机器人自己学走路

首届吴文俊人工智能最高成就奖得主陆汝钤:想象力比知识更重要

实现通用人工智能还要多久?Hinton与AlphaGo之父这样回答

汤唯成了百度地图的“AI算法官” 女神背后靠的就是这些语音技术

政策监管趋严下机构如何寻变,AI课堂是否成少儿英语新风口?

 
 
九龙坡 房山医院 纱帽街道 宁蒗 十三陵胡庄社区
北区一路 理合务乡 西山北乡 东桑庄村村委会 灵山洞
澳门威尼斯人官网 澳门葡京赌场 百家乐破解 威尼斯人网址 澳门威尼斯人官网
澳门百家乐 澳门永利赌场 澳门葡京官网 澳门百家乐 澳门威尼斯人官网
澳门威尼斯人官网 葡京网上赌场 百家乐破解 澳门葡京官网 百家乐玩法
澳门葡京赌场 澳门葡京赌场 澳门威尼斯人官网 澳门永利官网 澳门葡京官网
老虎机定位器 澳门大富豪网址 现金三公注册网址 牛牛游戏下载 现金骰宝 年度十大电子游戏 大小点游戏 玩什么游戏可以挣钱 电子游戏厅 方法奇葩赌博网 巴黎人网站 pt电子游戏哪个最会爆 澳门巴黎人游戏 澳门龙虎斗注册 澳门大富豪网站 押大小排行 真钱打牌 明升网站 十三水技巧 电子游戏下载 二十一点平台 现金网游戏开户平台 澳门百老汇游戏官网 皇博压大小 真钱捕鱼 跑马机游戏 赌博技巧 巴比伦赌场官网 现金三公 地下网址 捕鱼游戏技巧 英皇网站 手机玩游戏赚钱平台 现金网排行 pt电子游戏注册 赌博技巧 电脑玩游戏赚钱平台 海立方游戏 ag电子游戏排行 希尔顿官网 太阳网上压大小 现金赌钱游戏 现金棋牌游戏 真人网站网址 地下开户 九五至尊娱乐网址 澳门梭哈游戏官网 奇葩袖赌博网 鸿胜国际压大小 博狗扑克游戏 德州扑克游戏规则 庄闲代理 奔驰宝马老虎机下载 现金三公开户注册 免费试玩电子游戏 GT压大小 新濠天地注册 现金老虎机网站 纸牌赌博种类 乐天堂开户 澳门永利平台 电脑版捕鱼达人 玩电子游戏入门 斗牛游戏 bbin压大小 网上电子游戏网址 澳门网络下注平台 明升国际网址 明升娱乐 捕鱼达人电子游戏 mg电子游戏试玩 二十一点游戏赌场 澳门万利赌场官网 大小对比网站 现金电子游戏 电子游戏实用技术 老虎机破解器 澳门梭哈官网 澳门百老汇赌场注册 千炮捕鱼兑换现金 网上合法赌场 PT电子游戏 波克棋牌官方下载 天天棋牌 凤凰棋牌 美少女战士电子游戏 什么游戏可以赚人民币 银河国际娱乐 澳门番摊官网 澳门梭哈官网 胜博发电子游戏 电子游戏打鱼机 澳门现金网 大三巴网站 PT电子游戏 澳门银河国际娱乐 皇冠比分 老虎机 真钱斗地主 德州扑克游戏下载 申博 澳门金沙 澳门金沙 澳门金沙 申博 申博 申博 申博 申博 申博 申博 申博 澳门葡京 澳门葡京 澳门永利赌场 澳门永利赌场 澳门永利赌场 澳门永利赌场 澳门永利赌场 澳门百家乐 澳门百家乐 威尼斯人注册 威尼斯人注册 威尼斯人注册 威尼斯人注册 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 澳门葡京赌场 葡京赌场 葡京赌场 葡京赌场 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 必赢亚洲 葡京网址 葡京网址 葡京网址 葡京网址 葡京网址 永利 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 永利棋牌 现金网 现金网 现金网