吴军信息论40讲(2)
昨日阅读2小时,累计阅读350小时
第三讲、大数据思维的科学基础
大数据的四类主要应用:
第一类、解决
人工智能问题,把过去看似需要人脑推理的问题,变成今天基于大数据的计算问题;
第二类、利用大数据,进行精准的服务;
第三类、精准的调整我们做事情的策略;
第四类、发现原来不知道的规律。
第一类的例子是语音识别系统——利用数字信息消除不确定性(香农的理论)
第二类例子是搜索,谷歌的搜索比微软的好不是算法好,而是数据量大
第三类的例子是滴滴
第四个例子是新药的研发
大数据的关键是思维方式的变化
第一部分 信息的来源
第四讲、信息的量化度量
充满不确定性的黑盒子叫信息源,里面的不确定性叫信息熵,信息是来消除不确定性的。信息量就等于信息熵。
一个系统中状态数量越多,不确定性就越大,在状态数量保持不变的情况下,如果各个状态的可能性相同,不确定性就很大。
很多复杂交易背后其实都用到了信息的可度量性,结构化金融产品其实也是赌局,金融公司卖给两方。
信息量的大小不在于长短,而在于开创了多少新知