全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
634 0
2020-11-16
呼吁为数据科学家提供新设备
我的第一台计算机是1981年的Commodore Vic-20。由于特德·贝克尔(Ted Becker)先生开设了计算机编程课程,因此对BASIC编程产生了难以置信的需求,因此我购买了该设备。我隐约地记得,一旦解决了所有语法错误,从使用打孔卡进行艰苦的编程过程到编写代码并观看程序立即运行的跨越,就成为了飞跃。尽管如此,它还是令人兴奋和令人上瘾的!事后看来,这种沉迷的一部分是由于能够对涉及乘积和总和的这些复杂计算进行编码的结果是可笑的。
确实,我对家用计算机的首次使用是由我对最终计算器的愿景所定义的。我花了几个小时执行复杂的计算,而这是我以前用计算器无法执行的。但是为什么会这样呢?如果给我展示一种与众不同的新技术,考虑到当前所有的技术进步,那么今天我会做出什么选择呢?科学计算器在定义我们如何看待现代计算机方面发挥了什么作用?最后,对于今天的数据分析专业人员而言,什么是理想的设备?这些问题的答案将是本文的重点。
便携式计算器的历史
使用便携式设备进行实时计算的历史根源可以追溯到数学的早期起源。当早期的人开始进行商品交易时,为了防止损失,跟踪金额成为至关重要的任务。早期的人开始使用他的手来计数少量,然后随着对大量关节的需求而开始计数整个身体的关节。可以追溯到公元前2500年的苏美尔文化中发现了转向专用算盘的第一个证据。这些设备使用了珠子和棒的组合来跟踪更大的数量。随着我们的生活变得越来越复杂,科学和数学不断发展,人们创造了满足这种需求的设备。在1916年纳皮尔的骨头,计算尺(1622),帕斯卡的计算器(1642),Colmar的计算器(1850),Curta计算器(1942)和数字计算器(1970),Graphing Calculator(1985)都是新发明的数学技术发生重大变化而引起的技术重大飞跃的例子。John Napier对数的发展从根本上改变了大规模乘法和除法的执行速度。随后,很好地记录了计算尺的开发和影响,将其作为美国太空计划的关键组成部分。特别是,水星,双子座和阿波罗宇航员在处理火箭推进数据,执行日常计算以及计算重入和轨道轨迹方面均接受了广泛的培训。60年代,计算成为航天员训练的一部分,
拥有一种能够体现其拥有者的科学,工程,数学或技术交易的复杂要求的设备,可谓引以为傲。如果口袋保护套及其内容物代表着天才的印记,那么计算尺和最终的数字计算器就代表着该天才熟练地解决问题的能力。
从科学计算器到智能手机
惠普在1970年开发数字计算器时,便携性便成为游戏的名称。从1970年到2008年,基本计算器的几种版本包括:计算器手表,图形计算器,科学计算器和能够运行计算机代数系统(CAS)的计算器,因此,只需按一下按钮,就可以解决问题,求解或简化方程式。最值得注意的是,TI-Nspire CX II,HP PRIME和Casio fx-CG500都是具有这些功能的计算器示例。但是,许多这些计算器公司非常专注于支持教育测试行业,而不是创建面向需要即时分析数据的专业人员的功能集。最近访问大学委员会网站将使您可以查看制造商允许的计算器列表。列表很长,但是计算器不可接受的功能列表要简单得多。下图是详细信息的屏幕截图。
资料来源:这里
随着无按钮全玻璃手机的问世,被限制在具有单按钮配置的设备中的观念得以解放。iPhone从许多方面改变了游戏。在单个设备中,可以具有多个版本的计算器,可以满足不同的需求。如果您需要图形功能,则可以下载所选的图形计算器软件。现在,您仅受应用程序开发人员的创造力限制。即使这样,计算器硬件也不是用于计算的专用解决方案,而仅仅是电话和微型PC硬件的改编。如果设备是完全为满足当今分析专业人员的计算需求而设计的,该怎么办?硬件和软件要求是什么?
拟议的设备
我们可以放心地假设,我即将概述的要求将需要在硬件和网络方面取得一些重大进步。我还想建立一个前提,即数据专业人员需要不同于学生所需的硬件和软件工具。另外,我建议将我们的思想锚定在这样的观念上,即手持设备本身可能无法充分满足当今专业人员的大规模计算需求。既然我们已经建立了基本规则,我想确定当今数据专业人员经常执行的一些任务和角色。
数据分析专家的任务和角色
作为数据科学家,以下是定期执行的任务和角色:
数学建模—?建模是对数据的收集和分析,从而创建最能描述观察到的现象的数学方程。通常,建模过程涉及创建模型,验证模型,评估模型和完善模型的四个步骤。使用能够观察真实世界现象的设备并构建描述和捕获现象的数学模型将非常有价值。将这一概念扩展到设备将意味着捕获现象的照片或视频将是有用的,但在其实现方面受到限制。尽管对各种图像进行图像处理将很有价值,但这里的挑战将是缩小可观察现象的类型。例如,时间纹理识别可以区分风中的树木和池塘中水的涟漪。这些现象与通过管子的水流或热气球半径随着直径上升而变化的速率完全无关。另一个挑战将是确定数学模型的形式。它应该是现象的图形,方程式还是描述?我认为,这三种表示形式都将提供对我们视为理所当然的关系的洞察力。现象的方程式或描述?我认为,这三种表示形式都将提供对我们视为理所当然的关系的洞察力。现象的方程式或描述?我认为,这三种表示形式都将提供对我们视为理所当然的关系的洞察力。
信号处理/时间序列分析-?能够快速动态创建和分析时间序列的能力将是巨大且备受重视的。 当前可以很容易地从下载的股票价格中生成一维时间序列。基于股票价格确定趋势,同时在视觉和分析上检测到由于随机游走而导致的错误趋势预测,将提供一个优势。当然,人脸识别技术可以使人们快速拍摄照片并根据人群数据库对其进行验证,这可能会在社交场合中发挥优势。我们已经有允许结合GPS,加速度计和相机来观察夜空中星座的应用程序。如果我们可以使用设备网络观察与类似设备同步的月球或恒星,并包括一系列遍布全球的网络,该怎么办?研究望远镜作为增强观测的数据?这可能需要在本地设备上使用功能更强大的镜头,或者需要使用网络摄像机。如果我们使用这种功能实时观察事件怎么办?单个故事的多个视角将改变新闻的报道和分析方式。例如,一次枪声的音频可以在多个设备上使用,以查明信号源的确切位置。
机器学习/深度学习-?监督学习(回归,分类),聚??类,降维,结构化预测,异常检测,人工神经网络和强化学习都需要具备从现实世界中提取数据并应用算法确定关系的能力。另外,拥有一种能够快速识别变量之间关系并具有进入区域,国家或世界范围内已认证数据库的能力的设备,将具有非常重要的价值,从而可以即时进行更复杂的研究。
统计与数学—?该设备应具有在大多数科学计算器上都可以找到的标准统计软件包。此外,更高级的应用程序还与统计软件包相关联,例如R,Scikit-learn,Mlpy和Statsmodels。这些软件包将支持各种分类,回归和聚类算法,包括支持向量机,逻辑回归随机森林,梯度提升和朴素贝叶斯。通过支持C ++,Python,Java和R的各种库访问数值算法。
创建数据API ?—与需要通过Web访问其数据分析或需要新应用程序的客户打交道时,应用程序编程接口(API)是至关重要的组件。在健壮的开发环境(例如Anaconda,R,SAS或许多其他数据分析平台)中开发API至关重要。同时,请注意可能管理您的API的所有法规。例如,对于财务数据的处理有严格的规定,而这些规定经常被新的从业者所忽视。
数据模拟,数据清理和仓储以及数据查询?—拥有能够处理大量数据集的设备将需要比当前便携式设备更多的RAM。运行模拟,清理,仓储和查询将需要一个强大的体系结构。该设备将需要能够处理MapReduce的分布式计算实现(例如Hadoop和Spark)的需求。作为替代方案,图形数据库可以提供可以利用的计算效率
操作系统
该设备将需要能够运行多个操作系统,具体取决于用户要求。基于Unix的操作系统将是首选。能够具有多重启动系统将是允许访问iOS,Windows 10和Unix应用程序的理想选择。
硬件要求
物理设备应具有全玻璃触摸屏,并且设备的一部分专用于具有大量传感器。这些传感器应包括基于所需应用的模块化选项:
带有触觉反馈的触摸屏显示器,能够切换反馈
接近传感器-这些传感器提供了一种快速切换设备各种模式的方法,以防止来自触摸屏的虚假输入。
蜂窝无线电-尽管此设备可以用作电话,但重点将放在以多种形式收集数据上。
多个GPS天线-无源,可以选择连接功率放大器以提高精度
麦克风-智能设备通常不提供高质量的麦克风。但是,此设备需要具有高质量的翻领电容麦克风以及具有正面心形图案以及两个胶囊,两个方向的图案的便携式电容式麦克风。
可拆卸的蓝牙加速度计-根据应用确定设备方向并提供观测和实验数据
红外发射器和传感器,用于实时动态检测温度波动。Seek Thermal和FLIR是领导此项工作的两家公司。对于难以触及的地方,在电缆末端安装一个可选的传感器也很有价值。
多摄像机阵列-广角35mm,50mm,具有80mm和200mm镜头的附接能力。有一个
蓝牙传感器阵列—一组可拆卸的蓝牙传感器,所有这些传感器的速率为96–128 Mbps,范围至少为300英尺,并能够自定义传感器类型和分辨率。
蓝牙书写笔/铅笔,键盘和鼠标
传感器的医疗应用套件包括:体位,体温,心电图,肺活量计,血压,脉搏血氧仪,血糖仪和脑电图
能够提供100 Mbps上传速度和200 Mbps下载速度以处理任何实时计算的移动网卡也将是理想的。这也将需要带有图形卡的主机计算机,该图形卡能够执行机器学习算法。
RAM和存储
设备应具有足够的内存来执行大型阵列,并具有八核处理器和至少32GB RAM以及至少2Tb的存储空间。由于处理器的需求和对热量的关注,该设备无需采用传统手机或薄平板电脑的形式,而是可以采用稍大,较厚的设计。
移动软件
软件应用程序的选择和性能将是我们建议的设备的关键组成部分。需要强大且可靠的移动集成开发环境(IDE)。Matlab,R Studio,Spyder,MS Visual Studio,SPSS,SAS,MS Excel,Wolfram Alpha,MapReduce实现以及甚至Tableau等数据可视化应用程序的开发人员都需要做出承诺并相互合作。这些应用将需要能够管理非常大的计算任务,同时又能平衡移动设备较长电池寿命的硬件。此外,MacOS,iOS和Windows 10需要发展,以满足针对专业数据科学家的强大移动操作系统的需求。
结论
对于希望能够在移动设备上执行非常苛刻的计算任务的专业人员,需要一种新型的设备。测试公司对现代科学/图形计算器的影响太大。这导致功能范围有限,并且在设计和应用中严重缺乏创新。尽管数十年来技术上取得了许多进步,但数学似乎仍然停留在传统的计算任务中。现在是时候转移到使我们进入新可能性世界的设备了。你怎么认为?您会对这种设备感兴趣吗?您认为哪些其他硬件和软件功能对此类设备的成功至关重要?让我们努力使新型设备成为现实。
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群