全部版块 我的主页
论坛 经济学人 二区 学术资源/课程/会议/讲座
1909 2
2017-08-11

2017年中国数据分析师行业峰会:大数据与人工智能_分会场(六)  


第四届中国数据分析师行业峰会

主题:大数据与人工智能—分会场6

时间:2017年7月29日(下午)

地点:中国大饭店


   内容:


   主持人:大家好!现场尊敬的各位来宾,2017年CDA中国数据分析师业峰会再过十分钟就正式开始,请您尽快入座!并将手机调整成静音。现场尊敬的各位企业嘉宾,我们亲爱的现场观众朋友们大家下午好。欢迎各位回到我们2017年中国数据分析师行业峰会—大数据与人工智能分论坛的现场;再次我代表主办方对各位的到来表示由衷的感谢和热烈的欢迎,谢谢各位。


$_JUT}(5PO3QFQ8D7FMM6.png


   下午的环节当中大家可以针对大数据与人工智能进行具体的探讨。今天下午分论坛的分享嘉宾有王琼(武汉大学镝次元数据新闻研究中心负责人)、李英伟(IBM机器学习&数据科学专家)、单艺(猎聘网首席数据官)王昊(北京极海纵横信息技术有限公司CEO)、罗飞(智众互动CEO、技术达人)、由天宇(亿欧公司副总裁、智库研究院院长),接下来大数据与人工智能的分论坛现在开始,现在有请王琼为我们带来数据算法与媒体创新的主题分享,有请。


   王琼:大家好,我是王琼,今天非常高兴能够有机会在这里和大家交流;我们实验室对于数据算法和媒体创新方面的研究,媒体和每个人的生活方式息息相关,回顾媒体发展的历程,会发现技术在当中起到了非常重要的驱动作用。从最初的印刷媒体、新媒体每一步都是技术在背后推动和助力。


   媒体之所以这么热衷于新技术,一方面是因为我们本来就是环境的检测者,同时我们也都非常希望新技术和应用能够帮助我们吸引人群,但是在2013年当我们说大数据时代已经来临的时候,我们看到媒体有很多和数据相关的应用和发展。而对于媒体里说数据是一个老东西,在这一波的数据浪潮当中,最早被大家关注的事件之一在2012年的时候因为纽约时报有一个专栏他们做了一个用数据新闻去预测美国总统大选,当时是奥巴马大选,发现新闻还可以预测未来,这是媒体人做的一件新鲜事吗?早在1952年的时候,CBS已经用大数据报道,来报道美国总统的大选。如何把数据这两个字关联在一起,而是把这一种报告方式叫做计算机报道,因为人被机器的计算能力折服了,而当时的计算机非常少见。


   2016年的时候我们用数据新闻,这回报告希拉里的预测,但是错误了;发现确实有一些错误。当然媒体要吸引眼球,更重要的是需要严谨,不然会丧失自己的公信力。到底算法的局限性在哪里?我们看两个案例。

第一、这是USA美国种族多样性,大多数新闻其实用不到算法,这个用到了,他们基于大量的人工普查的数据做了一个未来美国种族多样性;但发布这个作品的时候,同时非常严谨的说这是基于当前的社会文化和人口情况做的一个预测,未来会发展变化。因为天灾人祸都有可能发生,这个时候我们发现媒体已经更加严谨了。


   这个是BBC曾经做过的也是一个代表算法的数据新闻,基于大量的社会调研对整个社会圈层进行了界定,比如你家有几个孩子、月收入多少、平时喜欢什么运动、朋友圈有什么人,最后告诉你你在英国的社会到底处在什么位置,我当时在美国做的一个情况。那个时候薪水不是很高,朋友也不是很多,虽然自己觉得是一个文化人,但是通过这个预测模型最终我发现我属于劳动阶层,所有的算法和数据的运用都是有一个场景和局限。不过对于局限性不是面临的最大挑战。


   S更大的挑战在是我们现在看到的这四个方面:1、算法做内容成本很高,更多的时候还面临人才匮乏的局限性,所以我们不得不向研究机构、科技公司寻求支持,在这个过程当中涉及到一个权利的问题,不是普通的权利,而是信息和算法掌控的权利。当我们拥有算法和数据能力和我们不拥有这些能力的时候,我们心态会有变化,我们会因此感到自卑,我们面对很多问题的时候会做出不够理性的选择。虽然现在到了数据时代,大数据也常常被人们提起,可是对于媒体做内容的时候,我们需要有一个平常心,即使知道数据新闻的核心并不在于说是不是一定要有大数据和复杂的算法,而在于用科学的方法问合理的问题,当然数据和算法在媒体当中的运用不仅仅在于数据新闻的领域,这个部分再讲一个小故事,做了十多年数据新闻的一个名人,他说工作的核心是一样的。要变成可用的、有价值的信息产品。


   数据除了在内容方面,还跟媒体有其他的关联,我们主要再提一提智能推荐、我想大家都非常熟悉了,因为我们知道今日头条,当然能够在信息大爆炸的时代更快的获取信息,提高效率,而且同时面临很多的挑战,我喜欢看什么新闻就可以看什么新闻,并且提供了在细微领域具体的信息和支持,因此我可以完全畅游其中,

这个会带来我们过多的沉迷于自己的世界的风险,最终会变得非常的作茧自缚。


   第二、我们看到今日头条以数据和算法为驱动的一些信息的渠道和提供商的时候,对很多原创内容会带来冲击,因此对他们内容和团队都会有一些挤压。我们再来看是不是这个事情只能这样,实际上我们也在做一些反思。


   我们做了一个Google的浏览器,比如你是一个自由党派的人士,我在浏览自由党派信息的时候会问你保守党派的印象。比如这个按理这一次在美国总统的选举当中,推荐阅读中的算法有偏差。如果刚才只是一个简单的信息不会造成很大的威胁,更大的威胁是和人权密切相关的,比如说美国在很多州会用一个系统来评估那些罪犯在未来犯罪的风险,美国有一个独立的新闻网站非常好,只讲故事给那些愿意听的人听,他们用其中一个具体的数据检验,发现算法的准确率只有20%左右,会带来的后果很可怕。当我们提高这个案例的时候,是只算法的偏差,这个数据时代媒体非常重要的职责,就好像检验事实的真实性一样,我们需要检验和公众相关的算法他们的可靠性有多少,当然本身对于媒体自身的技术能力、储备、评估有更高的挑战。


   最后我们说一下自动化的新闻写作,主要是为了提高效率。不光会写文章,还要写评论,可以自动的编辑视频新闻的写作。他们就是可以运用传感器的数据来进行一些自动化的写作,未来写作趋势普遍的观点也是认为会被运用到更多的领域、会有更加深刻的报道、快速的报道、更高、更快、更好这三点之外,还有人反思是不是能够更准确,这个时候会有一个新闻真伪的检测性,并且越来越多的应用数据和技术。主要是两种方式。


   1、REUTERS追踪数据源的可靠性;2、facebook,整合一些更高的信息源做一个评判和反馈。


   这个领域这么宽广,每一个人、每一个研究团队、每一个实践者以他们的聪明才智做事情。我们实验室解决的是数据传播的问题,在数据的来源方面数据比较难获取,并且得到数据之后还需要花大量的时间做很多真伪的工作。数据的表达,要么就是高度定制化,另外要有很高的成本,我们就做了这些一个镝次元数据,通过提高高质量的聚合数据,这是平台基本的页面,包括零代码的数据模板,工程师很了不起,但是对媒体来说耗不起,而且数据对模板的智能匹配,还有多模式写作。


   再回到今天的问题数据算法与媒体创新,我们对这个领域感兴趣的可能是一个思考者,在这个行业当中是一个实践者,但是我想说的最后一句话在这样一个蓬勃、新生的年代,我到底想要做的事情是什么,我到底做的事情会怎么样影响别人。


7K@YSVF5C`%9Y({BK0GE4_Y.png


   主持人:刚才王老师主要是采用了美国的案例来说明媒体与数据之间的关系,为我们呈现了媒体数据和新闻写作中的数据和算法。接下来让我们用热烈的掌声用IBM李英伟。


   李英伟:大家下午好!下午讲压力很大,本来大家吃饱了会比较犯困。人工智能这一块现在非常热,把它压缩在短短三十分钟之内压力更高,我可能经常在跟大家沟通的时候有时候容易拖,今天争取会像王老师一样30分钟完成我的任务。


   其实我上次在跟我的客户谈的时候,我们的一个国务院规划还没有出来,马上现在已经出来了。其中有一句话很好:“人工智能会成为我们新一轮的核心驱动力”,可能前两年还在谈人机大战的问题,但是现在其实我们看各行各业,在我们媒体业的算法,当然跟我个人来讲算法和现实之间的模型匹配时时刻刻都要关注,只要做一定会想办法做好匹配。AI我们不知道多少亿的产值会在哪里产生,包括月初无人机就上来了,马云虽然也在做人工智能,但是做事很强,无人超市已经开业了。IBM在医疗方面、在全球也做了很多。在国内我们也在常识我们在帮助整个类似胃镜,在整个过程中多少前针找出异常和病症都是无限的。当然在国内针对金融方面

已经面临了,我们业界已经在做一些相同的尝试。


   IBM在人工智能方面,我们有一直以来的努力。很早之前提出了很多分析的方法和框架,在前些年在人机大战利用自然语言的处理,我们赢得了大奖。包括形成了一些论文,都是在这个方面做的一些事态,我们可能比较早的提出了认知计算,针对人工智能我们认为在三个方面比较重要;第一、我们需要机器要跟周边的世界进行交互,交互的第一步要懂得周边世界在做什么,不仅仅是传统的机器语言,还要懂得人类的自然语言,能够听懂声音。第二、除了这些我们需要了解更多的比如说一些我看最近好像也是IBM在做,通过人工智能的方式,来帮助整个农业方面去利用合理的水资源,而不是过量的饮水,能够农业最好的发展,减少废水的利用。其中一点就是说会读取大量的传感器的数据和信息,会连接起来,在读取数据的时候意图是什么,当这些LT的数据传上来的时候意味着什么,然后回归的时候要对方能够听得懂的语言在跟世界进行交互;拿到数据之后我还要在这些海量数据终不断能够学习,我们当前的数据基本上是反应了我们人类和自然的活动特征,这些特征并不是为我们人类全部理解,有一些东西大概知道,但是真正的背后模型是什么,有的可能本身就没有意识到。有一些专门的人通过一些归纳的方法可能会得到一些,但忽视这个方面的时候就没有拿到相应的信息。机器可以通过大量的数据中会捕获这些模式,不断的去探索整个世界的过程。最重要的是你有了这些以后还需要进一步的行动,我们要把这些数据进行提炼,变成真正对人类有意义的行为,这些行为需要有最佳的决策,如何优化决策,这就是我们所谓的决策能能力。基于这几个方面,IBM已经做了大量的工作。当然在国外也有很多实际技术方面的落地行动,包括语音的处理、自然语言的处理、对话的处理,这些都是已经以API的方式提供。

那我们再看我们当前的各行各业,通过熟悉的金融行业开始,我们现在在做的很多事情,这么多年来我们在具体的一些工作方面做了很多电子化的成果。我们为金融提供了很多跟客户之间互动的渠道,我们做了很多数据的处理和计算方法,我们会去做一些相应的帐务电销化,仔细分析,我们发现真正在其中做的时候,还有很大的部分是根据我们的人脑,当然人脑并不意味着一个人,集合了一个企业所有员工的智慧。整个企业对外部的请求和交互、理解,它的回应,拿进来之后怎么做数据的一些处理、怎么样根据外部的意图进行一些查找和日常运作中的一些方式,最后怎么样做一些最终的优化。对应到AI这个角度,就可以进行。


   针对这个我们可能需要一些增强,我们可以根据我们当前的认知的基础,跟我们在交互过程中不仅仅是按照格式化提供一些数据,可以拿手机跟我们机器进行自然语音的对话,可以在网上随意的敲一些键盘。背后就会有相应的进行处理,我们会捕捉他的意图、他的需求是什么,我们帮助他找到最合适的解决他问题的方案,最后得到一个双赢。这个双赢可能更多要完成对企业的利益最大化、对客户效益最大化;这是AI思考问题的新的方式,从这个思考我们发现有很多的工作可做,当然这个我不相信讲了,有的时候做技术需要画一些东西。

总体来讲,我们在这个案例中我们可以看到我们可以去考虑和帮助客户能做的事情:1、我有一个认知的渠道,我可以优化我现在所有的渠道;2、我可以可好的认知和理解我的客户;其实我们现在很多地方这一块已经做的比较多了,甚至他给你自己更知道你自己的需求;3、当你有需求的时候,我们在合适的时间、地点推荐你合适的方法,达到双方的优化。


   具体的事例比如说我们会通过认知技术根据客户的一些自然语言,可以让客户不至于说非要理解我们具体的业务语言,具体的技术语言,从而达到让客户的体验更好;通过自然语言处理,我们可以理解客户,他提到一个问题或者说是什么含义,当然这些含义背后必然我们会用到一些算法和技术会进行整个的训练,从而真正能够理解当客户在说他的话语的时候,我们知道他背后含义是说希望要求没有合适的产品,找不到合适的产品,也许会意味着说会需要一个更高收益的产品,对投资方面来说。放到语言方面,我们对客户本身的认知和理解的加深有很多方面,我们对客户过程、行为数据的搜集,跟兴趣的搜集来完成对未来行为的预测,我们更好的能够认知客户、更好的了解他的过程中,从而对未来有一个更加准确的预测。当然其中的技术会非常多,包括推荐、包括深度的分析,几个方面,简单来讲,我们过去的数据其实是一个很大的金矿。如何挖出来是很重要的一点。无非是说我们在要做到的目标,应该是说我们能够在合适的条件下,我们能够认识到如果我们很好的预测客户什么时间有什么样的预测,他的偏好是什么,我们就能够把广告变成感兴趣的内容,把推销变成一种服务。这个是我们所希望走的方式,当然通过我们传统的一些标签化的方式,能够对客户有更深的理解,同时对过去的数据处理在行为、感情方面进行分析,得到一些比现在更多的分类以及一些标签和一些处理。我们对客户理解以后,我们有一定的预测以后,我们还需要对我们业务本身有一个更好的优化和过程。比如我们针对客户的预测,我们让他什么时间针对一个过程,其实是我前一段做出来一部分的一个东西,我们在这个过程中可以发现整个客户在某些方面是符合现实的,算法和现实世界的匹配,能够在一定的时期之内可能会跟我们下一次交互也许能帮助我们了解在什么时间做什么事情。


   另外,更近一步,所有的事情其实对客户的认知很多年前我们已经在做了,随着技术的进步越来越精细化。现在非结构化数据越来越多,我们可以在一些非结构化数据中提取一些不容易发现的问题,从而更好的对客户进行分类,以及对客户有一些相应的更深入的认知。当然这是一个例子,也是在美国大选期间通过视频的分析来完成的。我之前的一个工作,比如说我们针对投资的一些处理的时候,其实很久之前,我们在投资上有一定的模型和算法,而也起一定的作用。随着技术的发展我们也需要不断的创新,比如说风险和收益在投资里面是最核心的内容,也是最容易被膨胀的内容。以前很多是假设在某一段时间之内、某一个时期之内,我们的收益和风险基本不变,基于这个数据的时候,我们在推算给客户什么样的产品、我们在计算客户什么样的配额是我们做的一些基础。但是现实中,风险和收益是不断的发生变化的,虽然在这方面的论文比较少,但是目前随着技术的拓展、随着计算能力的提高,我们可以在上面做一些常识,到底我的收益基于一个什么样的变化、模型是什么、风险和变化方式是什么,依赖的数据是什么,我们用什么方式进行初步的处理,跟我们的传统方式对比看哪个更好,这可能都是我们需要做的时候创新的点。当然,我们还拿投资为举例,我们为客户投资组合的时候,我们都希望针对一些不同风险、针对各自的偏好、在不同风险、不同收益几个产品进行组合,什么在是最优,就需要用到一些运筹学等规划的问题。这就是我们要在做决策的时候要取最佳的效果。在这个情况之下,我们怎么样运算我们目标是什么?约束的条件是什么?比如这个人我们通过对他的认知,知道他不喜欢或者喜欢高科技,我们在高科技这一块有一个约束总比例不高于多少或者不低于多少,类似于这方面的约束条件,最后可以得出一些方式。当然,这些可能在进一步来讲,我们现在在深度学习方面有很多进展,我们如何应用深度学习的工作进一步拓展我们的准确率,当我们有一定的数据在进行处理的过程中,能不能从原来得不到的一些信息,比如情趣对市场的关联。比如我们可以随时从一些财经媒体说拿到相应的评判,比如说我们可以去得到不断的去分析法规政策等这些内容,我们通过大量的数据、文本信息里面去拿到对整个相应的股票影响的方式以及程度,加入了我们整个算法过程当中从而修整我们对未来的预测,这其实已经看到了有论文出现,在这儿其实已经有一些相应的尝试。当然,我们做的就是不断总结之前,前面的一些经验其实机器学习和人工智能第一先是学习,机器要学习人类的能力,比如投资学中很重要的一个特点当处于股市熊市、牛市的转化和处理,如何把握到观点,我们可以利用到一些算法来去找一些模式的匹配,什么算是熊市、什么算是牛市,而且通过机器快牛、慢牛、平稳等等这些东西,最后我们如果能够找到转化点,也许就能够在我们的业绩上得到更好的提升。


   做这些事情我们之前更多讲的技术的促进,但是仅仅技术是不够的,或者平台也是不够的,整个的人工智能是需要与世界进行对话,和整个生态环境是离不开的,其实这些本质还是来源于人,我们需要有大量的数据专家、业务专家、计算机科学家、算法专家共同去提升整个的工作;所以我们考虑整个的发展,我们需要考虑三个支柱方面共同的努力。放到人身上来讲,这个图现在已经有一些第二版、第三版了,针对数据科学的部分,我们需要很多跨行业、跨领域的知识,确实专门一个人具备方方面面的能力很难,但是我们可以也一个团队组合我们相应的能力,完成不同的工作,也是在这个方面一种模式。另外,AI很重要的一点包括机器学习不仅仅是学习,最重要的我们让他变成学习的机器,整个我们工作、我们的创新、我们的一些业务的运作应该得到不断的提升,我们数据在不断的获取当中,不断的数据的增量进一步推进我们学习机器的能力、机器学到更深的知识之后再运用到人当中,完成闭环,我们支持闭环的持续学习。我们可能也是在这方面需要一些努力。

最后,现在已经具备了我们的数据,我们有我们的业务专家最懂自己的业务就是自己,我们有一定的相应的一些IT的一些同事已经在做系统,我们再能够把人工智能的人员、技术、咨询的一些能力、方法结合起来,从而能够让我们得到一个更好的结果。


   本来后面还有扫码,现在没有了,我到这里了。


   主持人:非常感谢李英伟先生的分享。如果说大家有什么问题少稍候想跟我们分享嘉宾交流的话,下一个演讲嘉宾演讲完之后就可以进行提问。接下来让我们用热烈的掌声有请下一个分享嘉宾猎聘网的单艺给大家带来的人工智能与人的职业发展。


   单艺:首先感谢CDA给我们这么一个机会讨论一下人工智能和人的职业发展的主题。今天从我实际的工作和经验做了一些思考。这是我的简单的个人介绍,我现在是猎聘网的首席数据官,主要负责大数据、机器学习和人工智能技术的应用和开发,我之前做过搜索、广告这些方面的数据分析,但是加入猎聘网之后做了一个兼职的工作就是职业顾问,我是在做招聘的,我要知道各行各业的发展,的确我可以帮到大家,我们可以看到很多数据和各行各业人才的发展,我们可以给一些朋友做职业的咨询。今天主要讲四方面。


   第一、AI助力职业发展;


   我自己的实体工作还要发展来看,高质量的人才特别重要;最近从去年之后,开始有一些新的论调出来,人会随着人工智能的发展会突然失去工种,人才就不会那么贵了,这是一个问题;现在经常会看到人讨论人工智能会不会消灭人的工作,会干掉人的工作,这个是非常射门的一个话题。接下来我会举例说明。


   什么是人工智能?有一个很简洁的定义,人工智能就是一种Agent,能够感受到环境采取行动,目的是说让设定的目标能够利益最大化,是能够适应环境,根据环境去做一些行动,能够不断的提升目标。不如说无人驾驶会带到某个地方去,会给你推荐一些个性化的物品能够得到更好的用户体验,这都是AI的具体应用,而且还分为强AI、弱AI。所谓强AI就是像人一样,有广泛的、自主的、学习的能力;另外一个就是只能做一件事情,是为了这件事情而设计的,现在来讲强AI还没有出现。


   具体在研究领域,像技术的推理、知识的存储、获取等等,具体看人工智能是如何助力职业发展的?

首先猎聘网不同的人有不同的求职需求,像这两张图,左边是给非常资深的工程师或者工程师的领导者的一些职位;右边是比较初级的产品经理的职位,不同的人在我们的网站上想找的工作是不一样的,所以我们应该给他们提供个性化的、非常贴合他们职位的选择;传统讲,一个人可以去搜索、浏览,但是浏览纯看一小部分,搜索是非常比较复杂的,不像我在普通的界面上敲一个关键词就可以找到。我们找的是工作机会,考虑我的行业、职能、技能、地点、薪资都要考虑,每个人做好搜索是有一定的难度,从他使用角度讲、从他对行业的角度理解都需要理解,用户需要智能的职位系统,职位招聘业务里面其实跟传统的电商、电影、娱乐的推荐其实不太一样,这个需求虽然这个产品也叫“推荐”,但是用户找工作的时候,有相当的要求在这里面,所以要求比较高的相关性,要求基本达到了像搜索引擎,我希望推荐给我的职位跟我自己搜的效果是接近的。


   企业这边要求更准:第一、企业是非常保守的,我们个人还允许看到一些不太合适的不投递,但是企业HR工作很繁忙,要明确职位的要求,也不希望陌生的跟这个行业、跟这个工作没有什么经验的人来消耗他的工作时间。所以是非常保守,对简历要求非常高的。和点上是不一样的,求职招聘里面要求是非常准的。第二、B和C的需求差异巨大。


   在看到我们猎聘网统计了一下,根据国民经济的划分标准我们有1200个细分行业,我这边有厚厚的一本书,就是《职业分类大典》是国家出的,现在已经到了后工业时代了,人的职业分工是非常细的。所以这个也是很大的挑战,隔行如隔山,每个行业有自己独特的技能要求、背景要求、专业要求,所以如何理解这些事情,理解每个人的背景、每个职位的背景、每个公司的背景,这都是特别大的挑战。而且数据的质量,虽然猎聘网有超过3600万的注册用户,每天在线的职位有七、八十万,但是这个跟我以前做的搜索和广告小了很多,所以数据的规模和质量都是会出错的,比如一个职位HR一疏忽,发一个职位其实是两个职位,这个事情也不容易。我们在给人推职位的时候,我们用了一个比较经典的架构,我们先会用文本挖掘机器学习的方法构建我们三个画像(人才画像、职位画像、公司画像),通过好几轮的筛选,最后通过很大的机器学习的模型做排序,形成了最后的结果,给人推职位。这个理解成为通过一些简单的算法先初筛,接下来精选,形成三个臭皮匠顶一个诸葛亮,这样可以推荐出一些符合求职者需求的结果。另一面,我们用前面的系统给HR推,那我们就会再改一套系统,也是类似的框架,多策略融合机器过滤的方法,HR推荐人才,这方面系统现在上线了,经过几个迭代以后取得了令人满意的效果,我们在内部的测试中,发现机器推荐的相关度已经可以和和推荐的相媲美。

另外,从用户产品使用的需求理解来说,发现他在职场的发展也离不开人脉,找同事、找校友,尤其在亚洲和中国是很重要的资源,如何帮助他发现更多、更好的关系,能够跟他的职业发展有帮助变成很有意义的事情。我们专门做了一个人脉推荐的系统,通过一些基础的算法,再通过融合的技术形成一个职场朋友的矩形。这个是在15年初上线的系统,已经能够比早期的时候要求量是四、五倍,转化率高了50%。做了这些事情之后,背后关键的技术是有健壮的机器学习的系统,而且跟普通的机器学习系统有很大的不同,线上的系统更重要的考虑在实际运营当中能不能及时反映模式的变化,因为在实际当中,这种数据往往会出现各种各样的噪音,我们在这个系统中来讲,数据先通过一个实验管理和预处理形成特征,而且及时落地,避免了所谓的滞后或者数据不一致的问题,然后在生产模型,同时在整个模型当中做了很多的检测,因为一个错误的数据会带来错误的结果,背后输出以后形成的结果在实际当中效果怎么样,我们有及时的检测,出了问题我们可以及时发现,做人工干预或者保证整个系统的稳定。这是生产环境当中的系统和实验室系统很大的差别。


   再往具体的技术细节,我们在做这些模型的时候,但凡做过机器学习的人都知道算法有模型参考数的,比如层数、每层神经元数,还有提升次数、树的最大深度、学习率、样本采样率、特征采样率等等。


   我先讲一下这个事情为什么重要?可以用一个简单的神经网络完成,而且有一个重要的参数学习率,从这个图里面可以看到如果把学习率设的比较少,就是0.025,纵轴就是比较稳定和平滑下行的过程,如果可以加快学习率,当我调整到0.25的时候,学的快了但是模型不太稳定,如果再调整到2.5的时候就没法收敛了,所以小小的这些参数,其实对于最后结果的影响很大,所以我们必须要有很好的手段处理。所以我们会出现超参数优化的问题。


   目标就是偶然要找到一个在验证数据集上效果最好的超参数,而且数据性质是比较良好的,我们要挑战的是参数空间巨大、效果函数是一个黑盒子、训练和评估效果高,现在的模型也越来越复杂和大,我们跑一个实验室就得一个小时,所以要把参数调一次,单次时间就很长,所以实验的成本会比较高,所以我们做实验也不是可以无限制做下去的。所以问题来了,我们如何聪明的搜索到最佳的参数,第一就是手工调参,比如老中医就是不科学,把脉上火了吃什么也不一定管用,我们做科学的觉得中医的方法不是一个可靠的东西,但是没有好的方法之前全靠手工调参,如果团队没有有经验的专家在里面,调的半天也调不出好的结果出来。那有什么好的科学的方法寻找最佳超参数?我们可以一些点出来,一个一个搜索在简单问题上是可以用的,但是有一个问题,如果你分的比较粗、运气不太好不一定找到最佳的点;还有一种随机搜索做实验,只要花费在40%的实验就可以逼近最佳的点,这是一个行之有效又简单的方法,但是有缺点就是只能看运气,不一定能碰到最好的点;接下来我们可以考虑用统计学里面的一个方法均匀分布的抽样来做选取实验的点,看起来像是随机的,就可以在理论上随即搜索更有效率、更有把握的找到最佳的点,这些都是经典的超参数的方法。这些都还不是最好的。我们现在用的方法是贝叶斯优化的方法,我们会假设优化的目标函数符合某个先验分布;然后初始随机实验,根据观测结果得到后验分布。里面用到的模型就是高斯过程回归,具体数学的细节不讲了,这个模型非常优雅,把多元高斯联合分布,拓展到一个函数上面去,如果我们知道一些数据的点,给一个新的数据点过来,可以预测我在这个点附近效应函数的均值和分布,我们就可以知道在哪些点、哪些区域附近有比较好的结果,而不是随机选,这是给我们带来的巨大的飞跃。


   方法还是先是做一些随机的实验,虚线是真实的,在早期的时候只有几个点,所以蓝色的区域表示两倍方差的区域很大,或者有提升概率最大的点,或者说提升期望最高的点,我在这上面期望是最多的,还有一种方法找到我们在最乐观的一种东西在这个点上面,可以选任何一种就可以找到下一个实验点的比较好的选择。通过这种方法就可以避免盲目的做实验,不断的去学习、不断的更新这个参数空间的结果理解,比传统的要花大概少40%的实验时间找到最优的结果,而且这个结果的确整个来讲效果是比较好的,这是用高斯过程回归来优化超参数,而且也可以拓展到整个建模的过程,我们自己招人也难,有的活干不过来,像我们一个项目里面将会有上千个点,我们其实可以用自动,把这个方法拓展,自动化建模丢个数据给他,这个系统就可以把背后的效果很好的模型做出来,尽量少人工的干预,回头讲,对于做分析师、对于做机器学习的职业发展,我觉得也是非常有意思的事情,这种东西会越来越多,我们自己在内部做了一个小系统做这个事情。


   另外,我们的实验平台是基于强化学习做的试验平台,会根据试验的结果会进行流量的分类,在试验当中比人手来分更有效果。我们用的方法是Thomas Sampling,找效果最好的策略然后给最大的概率做实验,不断的学习,不断的适用于环境的变化,这是是挺传统的方案。


   第二、大数据的分析是可以帮助大家(政府、行业、企业、个人)做好行业发展。


   我们的方法并不是以线下调研为主,我们是以线上的平台大数据分析为主的方法。我们做的方法还是从原始的数据,比如说职位、简历、公司信息里面提取出职位画像、人才画像和公司的画像,这些是相对比较静态的,然后再把每天的用户行为整合进去形成最后的实时的人才画像的人才圈,通过统计的方法,分类、聚类最后形成分析报告。举例说明:跨行业人才流动的情况,我们做的主要行业分析都在上面,可以看到在2016年的时候,红线是每个行业流出最多的,大量超红的都出现在互联网,横轴是流出的行业,一行一行流出的情况,可以看到从这个行业流到哪个行业去,基本上都是在互联网行业流动,说明互联网行业有工作机会和很好的待遇去吸引人,很多的都出现在互联网行业。这是一个宏观上很好的数据统计,也是一个直观的统计。


   因为可以对每个人的技能做引流,比如有多少个月的经验,我们看不同行业他的人才技能积累的情况,前面讲互联网行业很吸引人才,但是互联网在这张图上横轴是掌握的熟练的程度、纵轴是讲掌握了多少技能,所以互联网人掌握的技能不太多,因为互联网是比较年轻的,相反能源行业积累了很多人才,有很高的素质,互联网其实很火,但在积累方面还是薄弱的。还可以看到各个城市之间人才的质量,横轴和纵轴跟前面是一样的,可以看到深圳就比广州掌握的技能数就多了很多,熟练程度也跟广州逼近,深圳的发展的确比广州要好,另外,像上海、北京这是两个传统的超一线城市,所以这些事情其实是可以给我们人才的发展、包括政府、教育机构做规划的时候是很有用的数据,这个我们跟国家发改委有很长期的合作,不断的给他们提供数据,帮助他们做人才方面的规划。


   第三、大数据和人工智能人才需求情况。


   我们可以看到AI和大数据工程师的需求是处在快速上升渠道,虽然只有百分之一点几,这个占比和量还是挺大的。在15年的时候,那时候需求量就快速上升了,但是做算法并没有,一直到16年4月份一下子飞起来了,16年4月份发生了什么事情?一下子对关注的点直接拉起来了,老板觉得搞算法的也不太清楚他们可以干什么,也不清楚他们有多少意义,一看到说微信可以打败人类,不干的话导致竞争力的丧失,所以各家公司都在搞智能化的项目;然后薪资跟底下线是持平均水平的,大数据比AI工程师高出20%。数据分析师其实存在已久的职业,需求也在稳步的增长,尤其在14年之后明显高了很多,但是没有像算法工程师爆发一样,但是你可以蓝色的曲线是均值,这个需求量、占比也是很高的;分析师比较讲究经验,年轻的分析师的薪资和待遇不会特别高,行业平均水平差不多,但是你可以看到如果经验多了以后薪水跟整个行业差距越来越大,到了十年以后企业肯定会招资深的分析师。我们前面提到了研究很多人的技能,我们把简历里面、智能描述里面把核心的观点列出来了,算法工程师来讲就冒出来很多数据挖掘和算法;分析师要求更有意思了,这是一些高薪分析师岗位的要求,不仅要求数据分析,也有很多业务要求,对业务、对商业、运营、销售、市场营销都要懂,尤其你一定要懂业务,这个跟普通的技术岗位不一样。


   第四、人工智能的展望。


   我们看一下,人VS人工智能的差异,你会发现人工智能在一些领域、比如说在记忆、计算、预测方面都已经比人要强很多了,但是人还是在很多领域要远远强于现在人工智能的技术。尤其是在推理、规划、理解、语言、创造方面,所以人现在还是有很大的优势;的确AI可以替代不少的工作,尤其是体力的劳动、危险的工作,这个图是麦肯锡做的一个分析,从行业和技能角度去看哪些东西是可以被替代的,你可以看到在资源采掘、体力劳动数据处理、数据搜集、教育都有不少的东西是可以被机器替代的,所以的确媒体上讲的算法会替代一部分人的工作的确成为现实的;所以对于未来工作的影响:1、强AI能否实现仍然是一个未知数;因为从哲学上讲,人是通过不断的实践跟世界的交互、跟人的交互有行动能力,机器要形成这样的人力仍然还有很长的时间;2、自动化!自动化!自动化!但是自动化会越来越多,重复性的工作、危险的工作、整个过程比如说传统的销售管理可能靠的是经验和销售的领导感觉和经验去管理,但是在我们的实践当中看到我们的算法在预测销售、在发觉客户的可能性、转化的概率、客户的订单大小可以超过人,这个时候如果再靠传统的经验去管理这个会让团队、这个组织竞争能力降低,别的人会用算法去管理,将来很多过程性的管理、客户的管理、销售的管理都可以用算法去做,人只要监督这个算法不出问题就可以。3、所以对就业的影响,创造(AI工程师、知识工程师、机器人工程师)、替代(司机、农场工人、客服、销售、助理)、增强(智能助理、智能技术支持、人脑接口);4、对经济和社会保障的冲击;


   未来是一个人机智能协作的时代,我们一定会跟某种机器一起工作;对于未来来讲,我们要做新时代的主人公,我们要学一点编程,懂数据,尽可能掌握一些机器学习、人工智能、更重要的是人的最重要的能力是协作和组织的能力、创作力,这一点我觉得中国的教育是比较欠缺的,我们对下一代要重点培养,这是很长时间要达到的。我的演讲就到这里,谢谢大家!如果有兴趣的可以加我的微信来一起讨论人工智能和人的职业发展。

主持人:非常感谢单艺先生带来的分享。人才大数据更新案例和AI的职业未来详细阐述了人工智能与人的职业发展的问题,再次感谢!刚才跟各位已经说过了,稍候我们有一个有奖问答的环节,我们可以踊跃举手提出,我们可以有在场的嘉宾来回答。


   梁书远:拥有数据和知识之后,可以挖掘很多有趣的东西;最重要的一点是数据的来源要全面,包括数据的质量尽可能良好一点,我想问我们所搜集的这些数据大约是怎么样的渠道?包括现在比较热门的话题叫“数据共享”,各位嘉宾觉得共享数据如何发展?或者发展到一个什么样的程度?


   主持人:一个是数据搜集的渠道有哪些?在未来数据发展的共享发展趋势是什么?我们请一下现场的嘉宾可以解答一下。


   罗先生:我来解答一下:


   第一、数据获取的渠道一个是可以通过爬虫的方式,现在网上的很多数据其实非常多,比如旅游相关的数据,可以爬携程的、去哪儿的等等,形成了一个综合各家数据很强的一个数据库了。比如说定理位置的数据可以爬百度和Google的,这种用爬虫去爬的数据量可以爬到很大;


   第二、数据共享方面,有一些数据是比较零散的,其实最好的数据共享就是我们用一些格式,现在有一个开源的公开的OPEN开机,共享一些行业的数据,各家往里面共享就是结构化的数据可以拿过来用,而不用去爬,而且应该建立一些纬度,就是数据和数据之间的关系。


   主持人:谢谢罗先生,那我们其他的几位嘉宾还有没有分享的,对这个问题解答一下。


   王昊:1)数据获取的方式爬虫是最便宜的手段,大家不要以为爬虫是偷,爬的过程就是让机器模拟人很快速,当然这个爬也是需要技能,一样也需要学习这些技能。还有很多其他的方式;2)还有买;就需要付费获取;3)再有一个就是交换,假设我有一个数据、你有一个数据,我们可以交换。4)政府未来开放共享数据越来越多,实际上还是有很多,只不过大家很少看哪些很low的政府网站,在美国这个趋势还是有的,政府开放一些数据还共同对数据做一些获取。5)机器学习和人工智能会生产出来很多数据,这种数据很可能价值更高,所以我建议朋友可以想一想这方面。


   主持人:谢谢王老师,我们这位姓梁的先生恭喜你获得了我们主办方为你提供的换书券,我们今天再给一个机会,哪个朋友提问,麻烦我们工作人员。


   藤先生:今天有这么多的嘉宾包括行业内的大牛到场,觉得有提问的机会很荣幸。我问一个形而上的问题,有一种说法所有的人工智能都是伪智能,跟人的智能在原理上不是特别一样,可能说以这个方向发展得不到向人类高级的智能结果的,现在这些人工智能模型只不过是一个传统统计学的延伸,还是在统计学这个学科做的都是这个范围内的东西;但是我觉得智能并不是这么简单的东西,我不知道各位老师、各位嘉宾对这个问题有什么看法?就是说我们走智能的东西是一个能够达到这种高度吗?我想问一下。


   主持人:人工智能是不是伪智能的问题上受到大家的关注,对于人工智能各位有什么想说的?到底能不能达到人类的脑部思想、脑部智慧的工作?从我们新文学的角度为我们分享一下。


   王老师:今天我们看到很多新的东西,其实早就有玄机和埋伏;对于数据应用会有很多的反思和批判,同时我真的就是一个相对技术的悲观主义者,我觉得人工智能的发展一定是有一个阶段的;未来,今天人的想象力会非常的局限,不知道会发展成什么样的,在我的想象当中他可以超越人、替代人、毁灭人,但这就是我内心的想法。我觉得他今天的发展来自于人欲望的驱动,这个“欲望”是一个中间词,而未来对于人类的毁灭来自于人类的恐惧,当你发现不太可控的时候会做一些伤害它的事情,但是它也会有自我保护的欲望,这只是我的一个想法。


   主持人:非常有自己的见解,那我们听不听罗老师对于人工智能的趋势,能不能达到人类智慧的高度?或者超越或者无法启迪?


   罗老师:技术的发展可能会不断的进步和迭代这是肯定的;但是我认为它所谓会毁灭人类不取决于技术的本身,而是取决于人和技术的关系。比如:战斗时期死的最多的人的战争是昌平之战,不会想到上个世纪40年代的时候,当原子弹核武器造出来的时候其实技术能力是可以毁掉整个地球和人类的,但是目前没有干掉地球,是因为人和技术之间存在关联,因为能力和智慧是两个概念,人是经过了几亿年的进化,机器的进化和人的进化是不一样的,我觉得核心还是人对技术的把控。


   主持人:非常感谢罗老师,我们经常说钱是万恶之源,其实钱就是一个物质,不恰当的用钱才成为一个万恶之源。我们刚才说的是发散性的思想。任何一个新事物的产生最开始的阶段都是不完善的,有可能是双刃剑,但是目前大家坐在这里共同讨论的主旨就是人工智能更好的为我们的人类服务。送给我们的藤先生一张换书券,在我们这个环节当中告一段落了,不过还没有来得及提出问题的朋友不要着急,我们整个嘉宾分享完之后,还会给大家带来新一轮的嘉宾。下面我们有请北京极海纵横信息技术有限公司的CEO王昊先生,主题是极海带您探秘地理数据的机器智能之旅。


   王昊:我今天给大家讲一讲有意思的事情,不知道提起地理大家在座的各位分析师朋友还可以知道哪些地理的话题,美国人口多、还是日本人口多等等,黑海是海吗?银海是海吗?后海是不是海这些都是原来想过的地理问题。但是现在对地理的理解又更深更丰富。我今天上午参加了众创空间的活动在举办我们自己的读书会,最后众创空间的创始人给我们介绍了他们的商业模式,最后大家有一些交流,就问说现在众创空间这么多,你们的核心竞争力是什么?创始人沉思了一会儿就说我们核心竞争力就是位置,地铁的位置。有一本书叫做《卧底经济学》,最开场就是讲星巴克卖给大家的是好咖啡还是宣传的第三个空间?实际上也是好位置,当然我们怎么样想到什么是好位置?到底好位置意味着什么?现在我们机器学习可以帮助我们回答这些问题。

因为我是长期从事信息地理工作的,原来在工作的时候也有过一些和国家政府打交道的基本,08年有一天我参加国家的一个会,在讨论我们对地图和地理数据开放不开放、以及用什么样的标准上网开的会,大家用的百度地图、高德地图很长一段时间,地图数据还是一个很珍贵的情报,不是那么容易分享的。然后就觉得这些官员加上我们这些从事者说现在没有那么紧张了,有那么一个软件都用成这样了,对国家地理上有什么东西、没有什么东西特别清楚,这个软件就是Google Earth,我估计在座的各位都知道这件事情归谁管。Google Earth看到卫星影像不重要,如果没有人标咱们就不怕上网,当时说没关系,美国人做这个东西对我们情报是一个巨大的获取。那么,走到今天,我不知道这个参数当他看到今天机器就能够帮助人解决这个事情,也许会挺难受的。Google Earth最早就是做情报出身的,后来变成大众版。咱们国家一直军队很想做一个咱们中国的Google Earth,还花一亿做一个验证,如果刚才嘉宾也说了,大家如果想在人工智能走的更远,好用的软件都可以学习学习。目的就是说地理、情报、机器学习一直都有很深的关系。大家只是知道这个原理,但是今天有新的技术可以帮助我们做更多的东西。




来源:CDA数据分析师峰会:大数据与人工智能—分会场

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-8-11 15:01:52


   人工智能大家也知道,从50年代、60年代、70年代一直到现在,阿里的曾老师说过“精准是新商业和旧商业的本质区别”,曾老师讲新商业和旧商业区别的时候的一句总结。每一个电商都想精准的找到一个用户,精准是找一个地理,人工智能或者说机器学习干这件事情很可能就比我们人类更有优势一点,它的效果用我们的双眼和自己的大脑判断要好一些。所以举例说明:这是美国亚玛逊刚刚首购的全食店的分布,全食超市本身的分布覆盖了美国2.3亿人,他们家庭收入的宗旨收入是82000美元,美国还有很多零售的生鲜超市,而且有1200多家店,覆盖了1.5亿,可见它的效率是比全食差一点。这就是竞争!对于一个合适的地方去精准的覆盖,能够更高效的运行,做这件事情大家把数据取出来去做统计,你看生鲜的分布在中部,没有认真的想过如何做。人工智能是可以回答什么样的问题?假设我想覆盖中国90%的高端人群,我最少多少家店可以做到、它们应该在那里,一个人回答就可以了。如果再加上更多的维护,用最低的效率做到覆盖就不太好做,但是机器就容易做,只要给一些训练的样子就可以把最好的店做出来,告诉你可选择的位置。


   最近有一个报告,是华旗发布的一个投资人对数据的关注程度;最关注的是在左边,大家做参考,因为这是调查问卷。我猜测将来有一天调查问卷这种形式一定会被淘汰掉。咱们就全当这个时代还可以正确表达他的认知结果,消费者交易的数据、定位位置是第二关注的,因为吃、穿、住、行和每个人息息相关,我平常周末总上三里屯消费就是不一样的人生,商家针对你的行为会发布不一样的产品,还有和位置有关的还有卫星和气象,卫星的数据受关注的程度不是特别高。


   人工智能是怎么和地理数据结合的?其实就是多源数据进行融合、训练得到一定的地理知识,找到推理进行决策,就是这么一个关系和流程。要有算法和训练,要有大量的计算机使得能够很麻烦的事情计算。我们地理上这些多源数据包括哪些?比如基本的地表状态、上面有的一些属性、人口的分布,越来越多的地理数据会在上面分析,比如某一个区域内移动支付的数据代表一定的人群和属性。比如:韩国和朝鲜的贫富差异也会做出一些分析;我们对一个空间的理解是纵标,实际上在地理上有更多的地标的时候就是一个纬度,比如说房价就多了一层,房价再去关联户数和人口的属性。举例说明:我们对机器进行训练,这叫停车场,电脑很容易识别出。特征如何描述?停车场这样一个特征如何描述呢?对一个图片有2000雷来描述,这些比较相近的时候机器认为他们是一类,就是停车场,这就是我们在机器学习和机器学习的一些方法。对于空间上的关联,这样一个表面就是长、宽、高,厚度就是不同的空间属性,我不知道各位分析师熟不熟悉机器学习的知识,就是深层的进行训练的方法。在空间上,深度上会越来越高,这个特征让机器知道到底是个什么东西。举例说明:三峡地区一个高风影像,第一层拟人眼睛可以识别出来一点,后面就完全看不出来了,训练出两百层以后告诉我哪一块是什么地理位置,机器学习会得到准确的情报。只要告诉我标注就可以了,这是我们看到的一些成果,就是这个影像告诉他道路是什么就可以提取出来,这个卫星也算是最近比较火的叫“鸽子卫星”,自动展开在天上跑,原来间谍卫星才可以干这个,现在就小公司就可以干这个,我要自己做卫星发射,这个就可以很快速的帮助我们对地球、对我们的自己所生活的区域快速检测的能力。精度是可以达到98.2%,我能够提取到只要给我一个影像,什么阿富汗、什么巴基斯坦,通过卫星影像就可以取出来,就可以了解国土到底是什么情况。而且街区道路达到了95.7%,这是四环之内所有的建筑物,同样的方法训练告诉他什么是建筑物,通过某种训练机制来选择。


   现在机器有一些不如人的地方,但是从人的判断本身周边有树看起来也不是那么完整,但是我们至少我们做到了第一代能够通过多源数据得到一些地理位置。对这一幅影像可以看到我们人类的大脑是没法解决的,这个例子是说机器怎么做一些搜索,比如画一个框里面有体育场可以自动判断出来,给它这样一个套路告诉你概率是多少。假设总有一颗卫星正好落在什么位置机器把它找出来,我认为机器就可以解决的人工智能,就是人的能力不足的问题,先不要说机器和人有做的事情是可替代的,这也是可以替我们做的工作。相当于我们给助手一个更好的工作,帮我们更好的解决。这是一个实时的例子,机器你告诉它什么就是什么,当然算法怎么样优化、参数如何调整,当时说的超参数如何解决,这就是我们在做的创业过程中解决的问题。当然这些问题都会有越来越好的方法实现,这就是找类似的。这个是找北京市所有的排污的烟草,停车场里面的数车就是这样的,哪个小盒子放着车,所以在美国有很多新型的创业公司让无人机看一下沃尔玛的停车场车有多少来预测沃尔玛的收入,所有的点都是一下子可以实现的。我们还做一些其他的事情,比如说我们做数据的事,把什么样的街区聚集在一起,认为是有一定能量和特征的最小单元,这个意义在哪儿?就是我们很多数据、人的数据、地的数据、物的数据、价格的数据在什么层级汇集,如果说建筑物和公司这个事情大家觉得可以解释,在五星级的写字楼里面工作是不是意味着我就是一个有一定经济能力的工作者,需要再细节一下,这个写字楼里面到底创业公司多、还是国企多,商家推荐的电梯广告实际上就是不一样的。这些数据分布在人的手里面,写字楼的数据是有房地产经营掌握的,但是关于企业的数据就是企查查这些做企业数据掌握的,就能够把这个数据堆起来以后增厚就可以做更多精准的事情。像我们街区分态变成更小能力的,所谓的最小能力一个人在一个地方活动,在这个区域里面90%的事情都可以完成,这就是能量最小的区域都是通过机器学习来训练的,看到人用移动APP上的轨迹,来看最终是在哪里就会形成新的数据,来帮助我们做新的业务,这是我们给全国34个城市做的划分,都是机器做的。


   再举例说明,对一块地好坏的判断,比如在国贸做一个众创空间,这个地方的品位是用什么决定的呢?咱们都在北京生活,国贸是一个高端白领的,放到上海就是陆家嘴,你的感受是什么其实你是不知道的,对于商业决策只是凭借自己生活的环境来决策的。我们对中国每一个街区进行区分,周围合作的商家有多少、拿这些学习得到结论,就会有很多标签给你一块儿选择地的好坏的指标,甚至这个指标是可以量化的。这是我们在做的一个工作,当然现在有很多实际的项目在运转这个东西。


   最后总结:


   第一、机器学习的标准算法越来越开放;


   第二、地理数据的通用属性和非隐私性;获取一些APP数据是非常难的,如果爬完再去经营这些事情要差一些,虽然说隐私比较差,但是有一个好处,70%地球上所有的事物都有一个位置属性,所以关联性不错,可以推延一些人类的属性,在数据分析的视野上看一些数据有意思的地方。


   第三、地理数据的机器学习产生精准;大量的动态数据和静态数据凑在一起,是可以做人的画像,原来静态数据没有太多意思,其实地理数据很多都是静态的,但是和动态数据凑在一起是可以解决画像的精准度。


   第四、机器智能创业是反稀缺的旅程;我相信各位在座今天坐在这里听各位嘉宾讲的,我相信大家对这个很感兴趣,即便不创业,在日常的工作中用新的方法当做自己个人创业的旅程,实际上在做的是反稀缺的事,对知识的动态、对行业的动态是稀缺的,实际上地理数据也是稀缺的,用更好的方式解答出来,做了反稀缺人生的机会会更多,祝愿大家在人工智能和机器学习的道路上越来越好。


   主持人:刚才王昊先生通过建立地理标签更好的画像,来围绕多元数据围绕的方法来给我们解答如何把人工智能和地理数据更好的结合。让我们掌声有请智众互动的CEO,罗飞先生给我们带来人工智能的应用场景。

罗飞:首先给大家介绍一下智众互动,是一家人工智能方案商Thinkphp核心开发者,《内外兼修程序员成长之路》的作者,除了外在的技术提升以外,还要强大自己的内心,一些偏哲学的内容也会给大家一些启发。这本书我会现场抽取三名幸运观众,演讲之后也会在展位有一个签售。我们先开始送书活动,一种方式是大家都在现场会议群里面,我在微信群里面开始抽奖,大家在里面发抽我,比如我说第九个出现的,把这本书送出去。来,大家可以把抽我两个字写进去,然后一说开始就发送。


   第一部分:人工智能的时代背景;


   我们都知道人工智能经过了三个阶段(三起三落),一个是1962年的时候,我们人工智能用程序可以下跳棋,这时候大家觉得好象机器能下赢人类了,好像机器可以监护人类了,感觉很兴奋。但是最后发现这个东西只可以下跳棋,电脑上面也有这样的程序,会发现这个东西普遍就不足为奇了。就落下去了;第二个阶段是1997年的时候,IBM下国际象棋,下赢了人类的一个选手,是不是觉得机器又要替代人类了,发现只可以下象棋,在各种设备上面都越来越多,结果也是说这一波的风潮下去了;现在这一波风潮2016年的时候下围棋引起了风潮,这个深度学习不局限于下棋上面了,比如语音、影像识别、医学等,跟前面两个阶段有很大的区别,我们第三个阶段有可能不会像前面两个阶段一样,很快衰落下去。而且我们人工智能从16年、17年风潮越来越旺,比互联网+更持续,而人工智能已经持续了两年多了,人工智能的这一场革命类似于工业革命,可能比工业革命更重要,工业革命解放的是人类的体力,而这一场智能革命引发的是人类的脑力,让我们人类重复性的工作、逻辑思维的一些工作能让我们机器取代。那么,机器取代人类的一些工作又会去哪儿?我认为可能会经历三个阶段:1、工业革命之前90%的人在种地,2、而工业革命之后只有10%的人种地,90%的人转向了制造和服务;3、而在未来机器取代人类后,10%的人种地、20%从事服务、70%的人进入虚拟世界。


   我们现在是一个弱智能的时代,人工智能在垂直领域可能突破人类,智力方面相当于四、五岁左右的小孩;怎么从弱智能到强智能,一个是脑科学的突破,依赖于纳米机器人,现在可以进入到我们的血液和血细胞,但是没有办法进入到我们的大脑,某一天可以进入我们的大脑,把我们的大脑原理扫描出来,其实人类对于我们大脑的运转能力是不太了解的,感觉是比较复杂的。脑科学里面其实缺少像牛顿这样的人,但是牛顿的三大定律把自然界很复杂的运行原理概括了。我们看大脑的运行原理感觉很复杂,也有可能某三大定律出来就把大脑的运行原理概括了,现在没有彻底的研究清楚。把这个东西化繁为简,所以第一步是脑科学的突破;第二步是硬件的突破,现在是另到1的存储,而它的存储其实不像人的思维,所以说硬件产品其实看很多公司已经在做了,现在我们运行一些深度学习,一般不用CPU,而用TPU,这都是在芯片上面突破;第三步在算法的突破;像Google开发深度学习的框架,这种算法会越来越突破;第四步是器官模拟的突破;其实人工智能就是在模拟人类的器官,比如说语音识别,是在模拟听,语音合成在模拟说,语音图像识别作模拟人的看,还有一些人类的器官现在模拟的不好,需要不断的去精准的,比如说我们的触觉、一些器官模拟的突破也是需要的;第五步是情商的突破;现在可以替代我们作左脑的工作,但是没有办法替代右脑的工作;右脑会有一个梭形细胞。经过这五步突破才可以从弱智能变成强智能。


   每一个革命性的技术有两个阶段:1、发明阶段(电,富兰克林发现的,但后面出现了这些应用电灯、电视、冰箱、洗衣机这些应用,才发现是革命性的技术;互联网刚被发明的时候大家也不觉得是革命性的技术,我们在几十年代的时候用电话上网还经常掉线,大家会觉得这个东西没有什么革命性,大家不会觉得那个是革命性的东西,但是后面电商出现了、这种应用性的产品出现之后才让我们的生活有所改变;人工智能处于什么阶段,语音识别、图像识别是一些人工智能的发明);2、应用阶段(机器人、智能音响等,这个格局还没有定);我觉得每个革命性的技术一定要在应用阶段要成功,应用阶段不成熟,发明阶段的东西炒的再火也是泡沫,应用没有带来革命性的产品迟早这个东西是泡沫,我们智众互动公司主要是在应用方面做一些摸索,所以就和很多垂直行业的企业合作,给他们开发一些人工智能的产品。


   我们对比十年前的智能手机,07年的时候iphone1代问世,目前的人工智能有一点类似于十年前的智能手机,你说十句话至少三句话不知道什么意思。一个字、一个字慢慢说,就是类似于十年前的智能手机一样,图标点几下才可以点进去。但是人工智能的发展有可能比智能手机快,经过十年发展触屏效果体验已经很好了,而人工智能现在虽然说体验不太好,很多识别没有说很准确,但有可能只要五年就能进入2C的很多应用场景,但我觉得现在做一些2C的大众化的一些人工智能的产品可能大部分觉得这个东西太少。可能未来两、三年,在垂直行业做一些商用的人工智能产品是一个趋势;而未来五年左右做大众化的人工智能产品是趋势。


   第二部分:人工智能的应用场景;


   我们刚才说了第一部分人工智能的时代背景是什么样的;那么,大部分现在的人工智能创业公司都在做技术上面的研究,其实在做发明阶段的事情。我们把这个东西真正产生革命性的一个效果一定要在应用阶段做一个突破,那么应用场景在哪儿?下面是给我们的一些思考。


   先回顾一下16年的时候机器人工,我所接触的起码是凭空出现了300个公司做机器人的公司,我们都在一个群里面。然后机器人中怎么形成的?一个是16年的时候春晚机器人伴舞、还有一个AlphaGo大战,今年我们发现机器人风已经没有去年高了,而且我们通过一些数据分析发现做机器人的公司有APP,发现手机APP有近一年没有更新功能了,也就是说一年没有更新功能的话,可能机器人不会有新的一些发展了。


   机器人上面我们做了小墨机器人,可以语音交互对话、远程控制、远程监控、视频通话、海量内容、运动控制等等,家长在外面工作的时候,家里面的孩子也可以用手机监控,去看孩子干什么,里面有一些视频和海量的一些内容。在机器人上面16年的时候风很大很多做机器人的,但是发现这样的市场,机器人很多是长线的态度,觉得媒体都在炒,现在是一个机器人时代,只是想买机器人体验一下;但是很多做机器人创业公司,做的机器人都是千元以上觉得还是便宜的,大部分的机器人身上有很多马达那种造价都要上万,这种机器人大部分不会买,导致机器人销量不高,而且做机器人的公司不承认自己做的不是玩具,我们承认做的就是玩具,就是给小孩玩的,把成本控制到几百块钱左右,所以我们比一般机器人公司销量要高,我们一直在更新功能,一直有销量;还有我们知道这个市场关注于低成本的机器学习方案,比如说零交互、里面有很多环形麦克风来收音、降噪,提升识别率的效果;但我们就做单麦,整个机器人的成本才两、三百,我们把单麦做到了极致。而在17年的时候,这就是智能音响的风潮很热,这个风潮是美国亚玛逊ICAN占尽了风头,不仅是这个音响,但是如果说音响的话本身能听歌之外,还可以聊天和互动,控制智能家居是不错的。觉得这个东西就会有市场,所以国内有很多大公司迅速的跟上,还有京东音响有七百多种100块钱到1000多块钱,各个价位的都有/科大讯飞、海尔/魅族/小米(人工智能音响)、联想/喜马拉雅、阿里(天猫音响)/腾讯国内的一些大公司也迅速跟上了。在小米音响发布之前,其实媒体有大量的报道,这么多公司做每个公司的销量不超过两万,小米现在又加入了,到底能不能把市场给打起来,有可能美国那边智能音响在中国不会火,很大的原因是中国的环境和美国的环境有很大的不一样,首先我们分析美国那边的人怎么用智能音响,美国的居住环境比较大,厨房也很大,但是做菜的时候不能用手的时候,用语音对话是一个强需求,跟智能音响说打开一下放一首歌,给我说什么菜怎么做觉得很方便,这是美国的应用场景。而在中国的厨房,首先美国那边做的菜主要是面包噪音不会太大,中国是炒菜,噪音和油烟非常大,跟你的智能音响不能对话,还有中国的居住环境,居住环境面积小,一般两室一厅,厨房面积更小,导致我们音响其实在中国的环境和美国的环境有很大的不一样,还有美国的歌都是买的,而中国因为政府控制版权,大家没有对歌曲买单的意识,但是音响的公司需要买版权,所以只能大公司玩,我们在36氪上面也发布过一些文章。


   时间原因我下面稍微快一些,我们主要做单麦的原交互,我们再看中国大公司的产品,他们找的应用场景又是怎么样的?百度前段时间发布会主要推出百度Apollo计划、小度对话式人工智能系统;但是这种规划式的零交互的产品有一些创业公司还是可以干的。很多大公司主要做的是个人助理的应用场景,有可能这些语音交互方式需要现在的小孩长大以后习惯了键盘就不会再用语音,而且小孩去学键盘打字是有成本的,所以说用siro小孩比较多,那种对话性的产品会得到大量的普及。这时候,我们不应该想个人助理的场景很少,我们应该想工作助理,专注于工作上面的应用场景,比如我们在保险和金融上面的应用场景,比如保险的工作人员要赔付率、价格根本记不住,但是这样的一个助理可以马上给他一个正确的答案。现在这个时代是信息爆炸和透明的时代,对于用户来说不要让我挑,信息多其实也是劣势,信息透明对于用户来说骗不了我,对于企业来说必须做出精品,不能欺骗用户。这两个产品未来这两个产品用人工智能的方式,基于用户精品有强大的信任。比如说我们对比一下卖保险,列表式的打开要选这么多用户就迟疑了,好像马上把这个关了,第一个环节和第二个区别是什么,但是美国那边尤其是卖保险的机器人,只要回答机器人五个问题,机器人就推荐最好的保险是什么,未来的用户选择趋向于单一,人机交互趋向于自然。卖保险的机器人拿到了很高的天使投资。人工智能的应用场景在哪儿?1、取代人;2、提高效率;3、娱乐;现在很多人工智能的产品不管是机器人还是智能音响都是打造娱乐的场景。人工智能的技术有深度学习、语音、图像等。而且人工智能、机器学习、深度学习的关系主要是深度学习提升了语音、语义、图像的识别精准度。


   很多人觉得人工智能是万能的,是媒体的一个炒作,我们需要数据和特征;并不是说什么事情给他数据就一定会学会,就像给一个小孩一堆热门书学日文也不可能学会。深度学习类似于水管一样,每一层的水管水流是可以控制的,深度学习模型其实存下来就是每一个法则、每一个节点的权重,保证每一个字都是准确的。


   第三部分:人工智能的技术;


   语音除了科大讯飞、思必驰、云知声、灵云、google、Nuance等等,图像识别有格灵深瞳;还有系统识别有语音操控原始APP、案例多多模态、目前多用于手表、集成了第三方服务。芯片,比如说智能音响用全志比较多,在音质处理方面比较多;具体区别时间原因就不说了。


   语音识别:三角兽、海知、图灵机器人、度秘,很多语音识别是基于问答对语义的问题。比如说动物园门票多少钱,世界公园门票多少钱等等,要录这么多问答,好的一个解决方式是基于知识图谱,从这句话里面匹配知识图谱,是实体和实体之间的关系,比如说景区下面有门票、有交通方式,我识别这个意图问门票,抽取是哪个景点、然后找门票,把答案反馈给用户。我只要把知识图谱建全就可以了。


   还有关于数据安全的问题,我们和很多传统公司合作,他们对数据安全是很重视的,不希望自己的数据流入第三方,这就是为什么他们不愿意和百度合作。最好的语音是意图处理与业务逻辑分离,只要识别是问天气还是问门票还是问什么,这是意图处理,识别完之后业务逻辑的处理,其实语音逻辑不应该管,应该交给第三方平台让它自己做业务逻辑的处理,这样才是合理的。现在市面上都没有分开。我们做的语音引擎的框架、用户提问、后面的处理方式要建立在客户服务器上面的,这个处理程序就是业务逻辑的处理程序,第三方语义、里面抽取实体明天天气怎么样,识别它的意图是问天气,然后把明天的具体时间列出来,然后识别比如说问明天北京的天气怎么样,那么把时间、地点、意图、这些参数再返还给处理程序,然后自己处理,一般的处理方式一个是匹配知识图谱,然后问答库,然后我们做实时人工,很多人在微信群里面问问题,小机器人把问题搜集匹配知识图谱、问答库和实时人工,群里面也感觉是机器人回答的,我们只做一些垂直领域的语音,大家有这方面的人工智能语音、智能客服、智能硬件的开发需求可以下来找我。


   访问者:你们公司有GPU和CPU怎么混搭的?你们GPU的平均利用率一天的?


   罗飞:大部分还是机器学习,所以GPU比较少,一个是做匹配比较多,还有一个贴合机器学习找一些相似度;用深度学习我们团队还是一个探讨的阶段。


   访问者:刚才听到语音识别,我们公司有三、四百个客服,我们招的客服都是学历比较低的,管理有很多问题;是不是可以通过一些应用场景答复,把用户反馈的问题用深度学习积累经验,当我们再新招一批客服的时候能不能反馈过去,生成一个云材料,让新入职的客服达到标准化学习的程度,能不能用我们技术解决?


   罗飞:重复性的问题机器是可以解决的;在付费阶段人比机器可能更好一些,在前期可以用机器做一些筛选,这个沉淀完全是可以做的。我分享一个阳光保险里面的案例,他们的知识比较多,刚开始的时候他们有手册,我们先给他做了一个知识平台、知识库,手册是比较慢的,每周都要更新,用知识库的话更新快一些,然后做智能问答的时候就是知识库,知识库达不上的可以提给专家,然后再返回来到知识库,由于时间原因今天就到这里,谢谢大家!


   主持人:谢谢罗飞先生,感谢您的分享和解答。我刚刚看到大家提问的举手非常踊跃。不要着急,在所有的分享结束之后会留出专门的问答时间。接下来有请亿欧公司副总裁、智库研究院院长由天宇先生给大家分享如何全面理解大数据驱动人工智能。


   由天宇:先介绍一下我自己,我是做行业研究和咨询的,一直做互联网的市场分析和用户调研,现在研究新的技术对于展业的影响。从我个人的经历讲,亿欧这个公司有三件事:1、媒体;2、活动(线下交互、品牌宣传);3、行业调查和研究。我其实自己最早和数据产生关系是12年前,那个时候数据和智能没有关系,在应用的数据领域最常见的,往往是问卷调研和简单的统计关系。我记得2008年我第一次拿到运营商大概几十万的通话记录觉得这个数据太牛了,发现excel几十万的数据根本装不进去,所以从数据的演化过程讲,怎么到智能的?我们看一幅图,这是一个变化趋势。这是我自己从二级市场挖下来的,我从86年整理到2016年,颜色其实是类型,浅蓝色是金融行业为主的,大家会觉得有是做电商的、有是做软件的、还有做搜索引擎的,这些公司的发展数据所驱动的,那如果我们看一下中国的情况,中国只有十年,因为中国上市公司总体上比较晚的,实际上可以看到一些变化,在最近的一年前两位就是阿里和腾讯,他们两个现在在中国的企业市值是远远领先的前两位,尽管业务有差异,一个是做电商的、一个是做社交的,背后成长快的领域是被数据所驱动的,我们从简单的数据表格的分析,到了实际上海量、大数据驱动的阶段,商业的价值都是被数据所承载和驱动的。为什么我们会谈人工智能,数据和智能之间又有什么关系呢?举例说明一下,其实我认为数据不是简单的数据本身,而是提升的一种能力。现在打开支付宝和淘宝页面,淘宝有十个广告位,首屏大概有一万创意,精准是区别于新商业和旧商业重要的标志,其实精准是对数据来说的,每个人支付宝的首屏广告位有三万多种,背后都是数据的驱动,人是搞不定这个事情的。


   我们简单的理解数据以前是一个数字、一张表格,现在是一个大数据;以前是完成一个工作,现在是一种企业和商业的盈利;用这个图解释一下关系;数据是有业务先产生沉淀在底层的,多数的商业是用云驱动的,中间是不同的领域和行业,随着行业和领域的变化,其实我认为AI的出现,是因为我们需要的数据的类型会越来越丰富,我们面临的行业的场景会越来越多,因为有很多的媒体属性,所以我们在过去半年之中做了大量的行业的调研和访问,今天给大家播放一个两分的VCR,看业界的人士是如何理解数据和人工智能这个问题的。其实我们还有每一个人的专门纪录片,其实我们大概访问了30位左右的目前在国内以人工智能为标签做创业公司的CEO,其实会提到两个点:1、这是一次巨大的产业革命的机会,是一个翻篇式的变化。2、其实很多的应用并不是在互联网,大家会想到在汽车、教育、医疗等等更多的场景。从大数据到人工智能最大的变化或者说智能到人工智能,因为智能这个词汇出现了很多次,在讲智能硬件的时候已经在提硬件了,智能我的理解更多的是自动化、连接、达到,所谓的人工智能是在用很多新的技术的算法在解决不同行业的问题,包括利用的数据不是纯粹的键盘和鼠标,手机的操作行为了,拓展到不同的场景了,所以会运用到语音、图像识别的技术,在我的家里面,超过40台左右的智能设备,我发现很有意思的现象,比如说小米的智能家居有一个温湿度感应器,每一秒的温湿度都是不一样的,而智能的传感器所有的数据都是被不断的记录的,有可能现在并不觉得有什么样的价值和意义,但是随着多样化数据的采集、包括床头的睡袋和智能灯所有的数据被不断的积累,多元的场景数据被积累的时候,AI发挥功能的场景会拓展到各个行业,为什么现在越来越多的人要把人工智能和结合到各个领域当中去,就是数据量的变化可能从现在到未来是十倍或者二十倍的增长,而不是看到的数据的结果。其实我觉得我也想和大家分析,一个技术去解决某一类的问题,大家觉得机器和人一样,就像我刚才回答一个朋友提问的时候,如果机器像人一样的时候,就不再是技术了,就人和技术进化到一个新的阶段了。


   最后讲几点我对人工智能的理解;大家一直在关心我们的工作、我们的发展会不会被AI取代或者说不是很难被取代,我们的很多工作会被取代,70%会进入到虚拟的工作当中去。100多年前汽车发明的时候,是遭到马车行业强烈的反对,后来汽车行业创造的就业空间和机会是远远超过马车的。我相信AI技术的发展会在很多领域会代替人,但是会创造出很多新的工作场景是我们不能预知的。比如游戏的玩家、品牌就是很多技术变化而创造的工作机会。会不会毁灭人的问题,我认为在我所认知的范畴它是很难毁灭的,目前全球最大的隐患是集中在朝鲜半岛金三胖的手里面,最后这个是小片子的完整版的扫描二维码。


   主持人:中国十大市值公司阐述了数据变化趋势。刚才跟大家已经提前预告过了,在所有的嘉宾分享完之后,还会有一轮观众的提问环节,我们都会有主办方为你送出精美的礼物。现在我们可以举手把您的问题说出来了!


   访问者:关于算法和数据、媒体,现在人接触的信息量非常大,会带来负面的困扰,您目前有没有看到新的解决的方法,如何抑制噪音?


   主持人:如今信息碎片化趋势之下,有没有什么办法可以来抑制或者减少这个趋势?


   王老师:据我了解来看,会有一些学界的研究者、观察者会反思这个问题,但是他们的反思是理性的、无力的,我们会觉得自己的研究也有价值,但是局限在我们理论的小圈子里面,如何返回给社会,最终影响到用户体验是一个非常漫长的过程。作为企业来说,更多的是以商业利益来驱动的,很少考虑反其道而行之,减少他的注意力在我的产品上停留,不可避免就会给大家带来一些非常焦虑的感受。比如我们现在用微信已经非常频繁了,大家日常交友和工作都在用微信,我的个人微信阅读信息有2000多个,最终不可能靠微信帮我解决,什么我身边还有一些朋友觉得自己把精力放在一件事情上的时候,就会停止社交软件;这就是人类和机器之间争斗,没有办法。


   主持人:好的,谢谢王老师,送您一份我们的购书券。


   访问者:我想问王昊老师,因为我们公司是做机器大坂车的,我们派了一些地推人员调查,我打开百度的微信地图哪儿有车停车场、我看完之后找了七、八个人一起看截图打印,当时我们在想人工智能可以识别,但是我们的技术不能,不知道王老师这一块能不能帮助我们,目前就是我们正在做,一个一个城市在肉眼观看。


   主持人:关于停车场智能识别的问题。


   王昊:其实你这个一点都不难,我们还碰到这样的需求,有一个做环保的客户,他也想说全国有好多的没有暴露的烟草,他想找到这样的企业帮他减排,实际上就是成本优化的结果。我们告诉他什么期间做这个事情,我们还做了地推的去扫街,机器可以自动划分出来单元,每个人发一张纸,所以不算特别复杂的事情。


   主持人:在我们活动结束,您可以找王老师面对面谈。我们还有最后一个机会!


   访问者:刚刚有老师提到我们说人工智能是会模仿人的大脑神经网络的,还说到了可能会有一种纳米机器人去进入人脑扫描人的神经节点,我想问一下即使未来能把人的神经网络所有节点扫描出来,但是人大脑的机制很复杂,并不一定是单纯的,很可能还有一些磁场的存在,还有一些生化的传导,这种东西人工智能又可以模仿出来吗?


   主持人:我们还是要回到了人工智能跟人的本质的智慧方面的问题,我们想哪位嘉宾来回答一下。


   罗老师:机器和人脑连接应该是会实现的,所谓的脑机接口,我灵感最丰富的时候往往是在半梦半醒之间会记录下来,但是会说到机器是不是完全可以和人脑一样,我总觉得是不一样的,因为人是几亿年进化的产物,但是机器有可能变化快,不一定用进化的词汇。机器可能越来越强,但是表达方式、机器的逻辑还是不一样的。我觉得可能很多方面都比人强,但是不会是人的一个复制,这是我的一个理解。


   主持人:我刚刚听到下面好象有其他的嘉宾也回答了。我们问问王老师对于这个问题的看法。


   王昊:现在深度学习是在模仿大脑神经原的连接方式,所以大家觉得好像这个是相互借鉴的。但实际上人脑看起来还是蛮复杂的,比如说婴儿可以识别父母开心不开心,这个事情机器做不到。人是怎么样感知到爹妈是开心还是不开心的,但我们现在假象一下脑科学这件事情走了几个神经的神经突出形成了一个回路,导致了深的一些反应。我们用机器实现这个事情,对就给一个加分选择,但是目前所有几乎的心理学、脑科学认为机器可以替代是不对的,如果武断的话,目前这个事情还是有一定的差距。这些年,确实人脑的神经研究是极大的进步,近十年发现了好多因素,所以最后也得到了人对于一件事情的认识是可以编程的,大脑是一个CPU在进行计算,你让他高兴就可以高兴,我不开心我吃点药就可以开心了,所以这是两件事情。所以人工智能和人脑智能并列齐驱、科学探索的。


   主持人:好的,非常感谢王昊老师。


   王昊:大标签实际上我们人类认知把复杂问题简化的方式,比如说我们对人看电影实在不太好去评论的时候,那个人是好人还是坏人,尤其是孩子特别简化的描述一件事情;如果说是图谱的形式不知道更复杂还是更简单,但是我相信这件事情可以做,只不过标签化方法更容易鉴定结构化的趋势。这个地区经济水平或者说区域的产能是多少,医学我觉得和影像有相近的地方,从大的角度实际上医学的角度也在识别,比如说肺癌什么样的组合就是肺癌。医生要求99%才可以真正信任这台机器,短时期内详细机器是医生的辅助,现在在这方面创业的特别多,我有一个朋友是做眼的图像,就可以识别出来糖尿病患者,他们争取做到手机植入的一个芯片就可以测算出得糖尿病的概率。因为这件事情的逻辑和原理是非常简单的,和我今天给大家看的是一模一样的。


   主持人:非常感谢王老师,再次谢谢你!目前我们的人工智能主要依据大量的逻辑和推算推进的,但是人类的思想、情感到底能不能用逻辑和推算来加以构架呢,我想这是我们人工智能未来探索的问题之一,非常感谢我们今天的六位嘉宾带来的非常详尽的分享和解答。他们也从不同的角度为我们进行了一场关于大数据和人工智能的思想盛宴!让我们再次把掌声送给他们!当然关于大数据和人工智能的学习,一下午是远远不够的!大家也可以通过扫描我们分论坛的二维码进行学习和交流,我们大数据和人工智能分论坛到这里就结束了,再次感谢大家热情参与!谢谢各位!






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-31 13:56:31
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群