网赢中国专注大数据营销 [会员登录][免费注册][网赢中国下载]我要投稿|加入合伙人|设为首页|收藏|RSS
网赢中国是大数据营销代名词。
大数据营销
当前位置:网赢中国 > 行业资讯 > 解决方案 > 大数据营销解决方案 > 机器学习,神经网络在控制科学中的前景和应用大吗?为什么?-技术方案
机器学习,神经网络在控制科学中的前景和应用大吗?为什么?-技术方案
编辑:高源,机器人学习 发布时间: 2015-7-3    文章来源:知乎
大数据营销

  以前学习机器学习的时候看到有应用算法来训练新式机器人自我移动的案例(来自斯坦福机器学习老版本课程),觉得很激动,因为这个过程很像生物界的学习过程。


  最近控制理论学习更加深入,也和老师讨论过这个问题。自控理论的老师认为当前行业里不太看好神经网络控制的论文,认为水分大,也不够有技术含量(可能不够纯数学==)。过程控制的老师(是一个很有经验的工程师),非常不看好这样没有经过实践验证,鲁棒性没有保证的算法,认为这个只是理论上的,实践上难以运用。


  但是我想,自动控制领域偏向纯数学的建模真的好吗?1,模型本身就是不精确的,各个部件的模型随实践也会改变,仿真的结果可能实际中根本就达不到。2,控制系统日趋复杂,耦合度加大,想要控制如同人一样的机器人,从关节,耦合的表示上就已经很复杂,数学的复杂度必然会限制它的应用。


  而实际中,1,生物的控制,人的走路,抓取,奔跑,就是长时间训练的结果,模型的精度和可靠性随着我们使用的次数变得越来越高,2,每个人生来就是不一样的,时间增长,每个人会长高,对应在控制理论里就是传递函数的变化,可是人能够很好地适应,说明这个算法适应能力很强,也有很高的通用性(不同的人都使用相同的方法)。


  首先需要澄清的是神经网络只是机器学习的一个模型,也是控制论的一个模型。


  她最简单的形式的本质是多个非线性函数合成的函数。


  


f_{all}(\vec{x}) =f_1 \circ f_2 \cdots f_n(\vec{x})<br/>

  


f_i(\vec{x})\equiv \sigma(W\vec{x}), \forall i \in \{1,2\cdots,n\}
\sigma

是一个非线性函数,比如tanh。


  这样看来他其实就是一个数学模型,并没有什么特殊之处。而且它和生物界的学习过程差很远,只是最初步的优化,要是考虑相似性,IBM neuron morphiccomputing更像一些,效果却不是很好。


  下面正式答题。


  不好意思,在此畅所欲言,抛砖引玉,也希望听到大家的观点。


  我在这儿把控制科学等量于机器人学来讨论,我相信这样简化并不会减少大家的兴趣。


  机器人学把对机器人的操控分为两部分, 一部分是perception, 一部分才是传统意义上的控制,control。


  机器学习对于第一点,perception,的作用不可谓不深。无论是监督,非监督的方法对机器人视觉,语言,情感都有不可磨灭的贡献。举几个例子,1. 在视觉识别和分类上面,基本都是机器学习的一个模型(卷积神经网络CNN)独占天下。大家可以看看这个数据库The KITTI Vision Benchmark Suite,基本在每个识别竞赛下都是CNN的改变版本第一名。2. 在情感计算方面,机器学习提供了在数据量大的情况下,识别当前状态下的情感的可能。Stefan Wermter用Recurrent Neuron Network(RNN)的模型分析twitter上每个状态的情感从而让机器人针对不同的情况做出不同的反应。机器学习在perception方面作出的贡献其实是对控制非常有用的,和Sensor Fusion结合在一起,他其实提供了机器人一个更真实的反馈。 只不过这个方面在传统的控制算法当中不受重视,我也就不在赘述。


  第二点就是传统意义上的的控制算法了。由于在计算机科学历史上,控制算法并不是主要的研究方向,所以学习算法在这个方向上的发展就有些慢。(传统上计算机科学的主要研究方向是图像和NLP)。而且以前的控制算法不需要多少输入,和动辄 1086 x 1086 x 3 x n 输入的图像研究不能比。所以人们倾向于找简单的方法(比如各种判定依据)。这一点上和图像的早期算法是相似的,都是人工的找判定依据(比如某种物品的判定依据)。计算机图像学之所以发生改变,是因为人们发现判定依据太过复杂,而计算资源又有发展,所还不如用学习算法学习这些特征。我觉得控制论也在往这个方向发展。现在很多控制算法开始大量考虑优化问题,我觉得就是趋势。优化问题普遍需要数据,很快控制算法就会和学习算法合流(基于机器学习已经合并了统计学习,以后机器学习也可以合并控制算法)。


  那么从机器学习本身发展出来的控制算法有没有呢?答案是有的,比如说总有几个神人,比题主和答主早个几十年开始考虑这个问题. 哲学上有名的人是Stefan Schaal,他的文章Is Imitation Learning the Route to


  Humanoid Robots?是对这个方向最直接的思考。虽然中国对这方面的了解还比较少,但是这篇文章已经有近1000的引用了,说明各国科学家还是很看好这个方向的。这之后很多人有过尝试,但是由于基本是零起步,所以并不是很成功。然后,然后一个叫增强学习方向立功了,这个方向也许很多人都不了解。他是基于强调如何基于环境而行动,以取得最大化的预期利益来学习。也就是说这个机器学习方向的数学模型允许试错存在,也就是你可以尝试,并在错误中学习。具体的数学模型可以参见Sutton的Book。


  由于数学比较复杂,在比较的少的时间不好解释。我就简单的带一下他的发展史,在发现增强学习中的马克沃夫决策过程(MDP)可以解决控制问题之后,人们又发现,连续的控制过程离散化之后数据会变得非常大。于是就开始直接优化在决策函数的超参数(叫做Policy Gradient 策略梯度方法),发现学习算法终于可以和传统控制有的一比了。


  不过学习算法和传统算法还有些缺陷,比如题主刚刚说的精确问题,普通学习算法精确度就和普通控制算法比就有些问题(毕竟人类帮这些控制算法总结了物理定律),神经网络就更差了。精确性是神经网络一个非常严重的问题,控制问题对模糊的容忍度比识别问题低的多。因为一次不好的控制就会导致的机器人损坏或者报废。就算在机器人学习算法的大牛里面对神经网络也是慎之又慎。大家一般都是倾向于用容易算出bound的基于马克沃夫决策过程的增强学习算法和容易求出方差的高斯过程回归。一个有趣的事实是,虽然大家都担心神经网络,但是一直都有尝试,因为它好处也太多了。比如和在部分领域最好的perception算法结合,比如训练过程简单,比如scalability非常好。解决对神经网络不信任这个问题,我觉得人们需要发展新的数学工具去解释比如CNN,RNN的复杂神经网络。


  我认为随着计算能力的增强,控制算法转向学习算法是不可避免的,因为慢慢所有的反馈都由大量的数据组合而成,而没人想一个一个分析。现在人们在研究结构性重组,高斯过程回归,深度学习对算法的改进。而这是我们的时代。


  btw.


  跨过GFW的朋友可以看看这个论文相关的视频,可以对学习算法如何进行控制有个直观的概念。


大数据营销
编辑推荐
图片行业资讯
  • 雷军隔空喊话董明珠:格力 小米欢迎你
  • 杨元庆:Moto在华上市一周预定量超100万
  • 小米洪锋谈O2O布局:做商城不做具体服务
  • 盖茨向不知名实体捐赠15亿美元微软股票 持股降至3%
  • 刘强东:允许我获取数据 冰箱免费送给你
营销资讯搜索
大数据营销
推荐工具
    热点关注
    大数据营销
    大数据营销
    大数据营销
    大数据营销
     

    大数据营销之企业名录

    网络营销之邮件营销

    大数据营销之搜索采集系列

    大数据营销之QQ号采集

    大数据营销之QQ精准营销

    大数据营销之QQ消息群发

    大数据营销之空间助手

    大数据营销之QQ联盟

    大数据营销之QQ群助手
     
    设为首页 | 营销资讯 | 营销学院 | 营销宝典 | 本站动态 | 关于网赢中国 | 网站地图 | 网站RSS | 友情链接
    本站网络实名:网赢中国  国际域名:www.softav.com  版权所有 2004-2015  深圳爱网赢科技有限公司
    邮箱:web@softav.com 电话:+86-755-26010839(十八线) 传真:+86-755-26010838
    在线咨询:点击这里给我发消息 点击这里给我发消息 点击这里给我发消息  点击这里给我发消息  点击这里给我发消息

    深圳网络警
    察报警平台
    公共信息安
    全网络监察
    经营性网站
    备案信息
    不良信息
    举报中心
    中国文明网
    传播文明
    分享