近日,在“2018清华工业大数据技术论坛”上,安筱鹏博士发表题为“数据+算法定义的世界——在不确定性的世界中如何决策”的报告。认为,几千年来人类社会一直面临的重大挑战是,如何在不确定性的环境中进行决策。今天,我们有了认识世界和进行决策的新方法:“数据+算法”。他同时强调,数字经济的本质就是“数据+算法=服务”。内容根据发言整理。2018年11月28日,清华大学大数据研究中心举办“2018清华工业大数据技术论坛”,安筱鹏博士在论坛上就数字+算法定义的世界进行了发言。
安筱鹏认为,几千年来,人类社会一直面临的重大挑战是,如何在不确定性的环境中进行决策。2000多年前人们面临重大决策、面对不确定性常用的方式就是占卜。五百多年前,宗教是人类面在不确定性的环境中进行选择的依靠。一百年前,人类送上月球的每一个决策、飞机研发的每一次重大决策的背后是基于科学。今天,我们有了认识世界和进行决策的新方法:“数据+算法”。数据+算法定义的世界
——面对不确定性人类如何选择
各位院士、专家,大家上午好!
在清华这个最高学府讨论大数据这个前沿课题,对于我这个经济学背景的人而言,有着巨大的压力和挑战。我经常是在技术专家面前讲经济,在经济学专家面前讲技术,所以我今天不给大家讲具体技术,讲讲技术带来经济社会影响,看看信息通信技术究竟给我们带来了什么了。
几千年来,人类如何进行决策?
几千年来,人类社会一直面临的重大挑战是,如何在不确定性的环境中进行决策,从游牧社会、农业社会、工业社会到信息社会,这都是一个永恒的话题,而在过去几千年人类是如何进行决策?我们来思考一下过去的2000年、500年、100年和今天,在不确定性的世界中人类如何进行决策,什么东西在影响人类决策。
两千年前,夏商周的首领要开打一场战争(犹如当年的贸易战),他们怎么进行决策?《史记·龟策列传》中记载“自古圣王将建国受命,兴动事业,何尝不宝卜筮以助善!”,是通过占卜来进行决策。面对一触即发的部落战争,出征前面对战争结果的无常,部落首领、诸侯国王们,求助龟壳裂纹、星象占卜,以预测等各种重大事件的走向,指导重大决策。
那小国寡民如何进行决策?《诗经》记载“尔卜尔筮,体无咎言,以尔车来,以我贿迁”。年经的姑娘要出嫁了,不知道未来自己的婚姻是否幸福,那么就告诉他的新郎尔卜尔筮,通过占卜的方式看看这场婚姻是吉是凶,如果卦象没有什么不吉,那就选一个黄道吉日开着车然后把我和我的嫁妆带回去。
2000多年前人们面临重大决策、面对不确定性常用的方式就是占卜。
五百多年前,西欧封建制度开始解体,宗教改革步伐不断加快,新教在西北欧取得了主导地位,有专家认为这是造成欧洲经济发达水平北欧比南欧好、西欧比东欧好的重要原因。
马克斯·韦伯在《新教伦理与资本主义精神》指出,新教伦理与企业家精神是相通的。新教宣传什么理念呢?就是“拼命挣钱—拼命省钱—拼命捐钱”,而不像一部分人想的那样,拼命挣钱的目的是为了拼命花钱。因为企业家认为世俗经济行为的成功不是为了创造可供于享受和挥霍的财富,而是为了证明自己是上帝的一个选民。
在这一种情况下,当企业家们面对各种不确定性进行决策的时候,他们的依据是什么,是新教思想影响着他们的决策,宗教是人类面在不确定性的环境中进行选择的依靠。
一百年前,爱迪生经过几千次试验发明了电灯,1969年美国人把人类送到了月球,同年也研发出波音747并实现首飞。人类送上月球的每一个决策、飞机研发的每一次重大决策的背后是基于什么?是科学。要发射火箭怎么来决策?需要计算发射窗口期,要计算月球跟地球的距离,要预测未来天气的变化,所有的这些所有都是基于科学的决策。飞机的外形如何选择、材料如何选择,背后都是基于风洞试验等空气动力学规律去选择,背后是科学。
今天,我们有了认识世界和进行决策的新的方法论。
我们清华大学工业大数据中心在青海有一个风电功率预测项目,能够对未来(明天、后天)风机的风力发电量进行准确预测;美国Uptake公司,需要对卡特彼勒工程机械运行状态进行预估,实现产品全生命周期的服务;新零售企业盒马鲜生,它只卖当天新鲜的产品,今天没有卖完就扔掉,需要对当天卖什么样的产品,销售量是多少进行决策;我们的手机用户,每天浏览的今日头条、淘宝看到的首页都是千人千面。这是一种新的决策方式,这种决策方式叫做“数据+算法”。
“数据+算法”的决策机制,不是对已有决策机制的一种替代,是增加了一种新的决策方式。
并非因为有了宗教,我们就不去占卜(许多现代人仍在用占卜的方式进行决策),占卜的方法在今天仍然很适用。我们用科学方法、科技的规律指导人们决策,但是宗教在很多时候仍然在发挥很重要的作用。现在我们又有了一种新的应对不确定性的方式,就是“数据+算法”。
应对不确定性是人类永恒的挑战,关于如何理解和认识不确定性,我们有三个基本结论:一是只有深刻认识不确定性,才能理解数字经济的本质;二是对不确定性的恐惧是人类社会认知的动力;三是不确定性源于信息约束条件下人们有限的认知能力。
化解不确定性需要经过“三部曲”
在过去上千年里,每一个个体、族群、部落、企业、国家等都要经历各种各样的事件发生,如战争、冲突、气候灾害、狩猎、农耕,以及企业的竞争和国家之间贸易,比如中美贸易战。
我们都面临着在不确定性的环境中如何进行决策的问题。这些决策正确与否会导致事情的成败、得失、利弊、对错、好坏、优劣等结果。而这些结果又会影响我们个人的幸福(我跟他结婚我是不是很幸福我不知道),部落的兴衰,企业的成长,国家的繁荣,历史的走向。
那么,如何来化解这些不确定性,需要经过“三部曲”。第一,我们首先要理解这个世界,理解和认知这个规律,这是我们化解不确定性的逻辑起点;第二,理解之后我们要预测将会发生什么,这是做出决策的基础和依据;第三,我们要去控制,是将决策付诸行动的具体路径。所以我们刚才讲的所有,无论是占卜也好,科学、宗教、哲学、科学也好,从本质上来说,都是来告诉我们如何化解在决策的时候面对的种种不确定性。
对不确定性认知的分野:从哲学到科学
对于不确定性的认知,也是从哲学到科学分化的一个重要的因素。
我们如何来认知不确定性,从哲学来看,在古希腊一开始就分成了两种不同的学派,到了近代形成了以笛卡尔为代表的确定性世界,认为这个世界是有序的、统一的、必然的、精确的及可预见的;而尼采、康德认为这个世界是无序的、差异的、随机的、模糊的不确定性世界。
从科学来看,由哥白尼“日心说”到伽利略再到牛顿三大定律,近现代科学成就不断强化人们基于确定性逻辑规律的认知,使得我们认为所有的世界,都可以用确定性据描述。然而,海森堡的“测不准”原理、哥德尔的不完全定理,阿罗社会选择理论不可能性定理,并称为二十世纪不确定性的三大发现。我们发现很多时候,这个世界并不是像牛顿定律所描述的那样是确定可预测的。
从经济学来看,对于不确定性的认知,始于芝加哥学派创始人奈特,将不确定性引入到经济学,打破了经济学研究中此前一般均衡分析为核心的对确定性环境的假设。对不确定性我们认为是信息经济学、行为经济学、制度经济学、演化经济学的一个基础理论。
最后我们大家熟悉的,从信息论来看,信息是干什么的,克劳德·香农定义“信息是用来减少随机不确定性的东西,信息的价值是确定性的增加”,信息最重要就是要减少不确定性而增加确定性。
什么是企业?企业的本质是什么?
我们今天讨论的是工业大数据,那么我们回到企业,什么是企业?企业的本质是什么?我认为在不确定性的世界中进行决策是企业最本质的属性。
企业是一种组织,这种组织跟市场、政府是一样的,它是一种配置资源效率的组织,政府可以配置资源,企业可以配置资源,市场也可以配置资源。企业竞争的本质是什么?企业竞争的本质就是资源配置效率的竞争,就是以数据自动流动化解复杂系统的不确定性,优化制造企业的配置效率。企业面临什么样的挑战?我们走进工厂、车间、研发室,会发现企业在思考什么问题:企业思考如何缩短一个产品的研发周期、如何提高一个班组产量、如何提高一个机床的使用精度、如何提高一组设备的使用效率,所有这些问题,都可以归结为一个问题,就是如何提高资源配置效率。
面临这些问题,企业有各种各样的决策,在信息不完备、不确定性的环境中决策,包括:新品开发是决策,客户定位是决策,营销策略是决策,研发组织是决策,供应链选择是决策,交付周期是决策,库存管理是决策,排产计划是决策,商业模式是决策,所有的都是决策。
那么企业如何进行决策,对于应用工业大数据来说,怎么支撑企业决策?就是要将正确的数据,在正确的时间,以正确的方式传递给正确的人和机器。这就是基于工业大数据,在不确定性的环境中如何形成决策。
谈一个红领的例子,青岛红领是一家个性化定制服装企业,是国家智能制造的试点示范企业,有些企业高管参观后感到非常失望,因为没有想象中一排排机器人、一条条先进生产线、忙乱而有序的AGV小车,而是一排排的工人在用手工的方式加工衣服,是一个典型的劳动密集型企业生产场景。
企业家们感到困惑的是,这样一个典型的劳动密集型企业为什么是智能制造的试点示范企业?有人说他跟富士康没有区别,不是没有区别,而是根本就比不上富士康,富士康的自动化生产线、切片机、机器人是非常先进,红领跟富士康有什么不同呢?
我认为自动化分为两种。一种自动化是生产装备自动化,叫做看得见自动化,机器换人,立体仓库,忙碌而有序的AGV小车。还有一种叫做看不见的自动化,就是数据融合在物理世界里面自动地去流动,把正确的数据在正确的时间传递给正确的人和机器。当你采集一个人上身的18个部位,22个指标之后,这一个指标首先自动生成一个适合这个人体型的一个版形,自动生成一个数控机床的加工指令,自动生成200个工序的加工工艺,定制化生产跟规模化生产相比,其复杂度、面临的不确定性远远地超出几个量级。
算法:将不确定性转化为确定性的最优路径
软件如何解决这一个问题,我想最基本的一个语言就是“if…then…”,将不确定性转化为确定性。“if:A”“if:B”是不确定性的,而“Then A1”“Then B1”就变成了一个确定性,这一转变过程就需要算法。那么把不确定性转变为确定性是否准确呢?这取决于你的数据及时性、准确性、完整性。
从规模化生产演进到个性化定制,这其中不确定性在逐渐增加。就像一场射击比赛,规模化生产是一个固定靶,大规模定制相当于移动靶,而个性化定制就像一个射击空中飞碟。要不断地感知它从哪飞起来,在哪拐弯,速度有多快,然后去分析、判断,进而决策执行。
在过去的一两百年已经完美地解决了产品的成本质量效率问题,而个性化定制出现的时候,过去已经解决了成本质量效率问题又重新冒出来的。不确定性又重新增加了,怎么解决?需要“数据+算法”。美国国家标准与技术研究院,对智能制造有一个定义,这个定义的核心词,我认为就是要对不确定性系统增加它的确定性。
做一个总结,如何能够把正确的数据在正确的时间,以正确的方式传递给正确的人和机器,需要具备两个条件:一是隐性数据的显性化,实现数据的完整性、及时性、准确性,把大量蕴含在生产制造过程、经营管理、客户行为、全生命周期服务的隐性数据不断被采集、汇聚、加工。二是隐性知识的显性化,就是对工业研发技术、生产工艺、业务流程、员工技能、管理理念等知识的逻辑化、数字化和模型化,使得大量隐性工业知识被固化在各类软件和信息系统中。