经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
休闲区 十二区
›
休闲灌水
基于网络大数据的社会经济监测预警研究
楼主
诗人都在海底
1423
1
收藏
2018-10-19
基于网络大数据的社会经济监测预警研究
精彩书摘
《基于网络大数据的社会经济监测预警研究》:
2.4.2网络大
数据挖掘
的定义
最早的网络数据挖掘概念是由OrenEtioni于1996年提出来的,他认为网络数据挖掘是数据挖掘技术在网络上的应用,这项技术综合了数据挖掘、网络、计算机技术、信息技术等诸多领域,是一种综合性的数据挖掘技术。
国内外专家学者对于网络数据挖掘的定义也是众说纷纭,《基于网络大数据的社会经济监测预警研究》选取一个认同率较高的定义:网络数据挖掘就是指从大量网络数据集中找到隐藏的信息,如果将大量网络数据作为这一过程的输入,将隐藏信息作为这一过程的输出,则整个网络数据挖掘过程就是从输入到输出的一个映射,即从大量网络数据集到隐藏信息的一个映射。
网络数据挖掘是数据挖掘的一个重要分支,但是相比于数据挖掘,网络数据挖掘有着一些特殊之处。
首先,网络数据挖掘的对象是大量的网络数据集,这些数据集大多是文档形式,而且具有异质性及分散式的特点,如服务器上保存的日志文件、用户发生行为留下的个人信息等,处理起来比传统的数据挖掘更加困难。
其次,从逻辑上来讲网络可以看做一个文档节点以及节点间的链接构成的图,因此通过网络数据挖掘可能会得到网络内容,也可能会得到网络结构,具有一定的不确定性。
另外,网络数据本身不是结构化的(机器不容易理解),但是传统的数据挖掘是基于结构化的数据进行的,是建立在关系数据库的基础上的。因此,有些时候数据挖掘技术与网络数据挖掘技术并不通用,即便要用也需要预先对网络数据进行处理,使其转化为传统数据挖掘技术可用的结构化数据结构,这也是网络数据挖掘技术的发展方向之一。
由于数据不断增长,类型不断复杂,网络数据具有了大数据特征,这时的网络数据挖掘已成为网络大数据挖掘了。2.4.3网络大数据挖掘的分类由于网络上的数据具有多样性的特征,所以在进行网络大数据挖掘时所面临的任务也是多种多样的,这里我们根据网络大数据挖掘的对象不同进行分类,网络大数据挖掘技术可以分为三类,即网络结构挖掘、网络内容挖掘和网络应用挖掘。
网络结构挖掘技术是指在挖掘过程中关注网络上隐含的链接结构,根据网络结构之间的关系(如链接间的关系与组织结构)得到隐含信息的过程。这种方式通过分析网页之间的某个链接及与这个链接相关的网页数和相关对象,建立起一个网络链接结构模型。网络结构挖掘可以用来对网页进行分类,从而进一步得到网页之间的相关联程度及近似程度,同时还可以帮助用户快速地找到与自己相关的网页。前文已经说过,逻辑上网络可以看做一张图,一张庞大的有向图。每个网络网页就是图中的一个节点,而页面之间的链接就是图中的边,可以是单向的,也可以是双向的。这样我们可以很方便、快捷地找到一个节点到另一个节点的最短路径,应用到现实生活中就是可以花费最小的时间和精力从一个页面访问另一个目标页面。
网络内容挖掘技术是指对页面的本身内容进行挖掘,页面内容的主要形式有文本、图片、多媒体音响等,我们要从多种形式的内容中挖掘出有价值的信息。目前,广泛应用的一些搜索引擎与推荐系统都是网络内容挖掘技术的现实应用,这些应用都是帮助用户从大量数据中快速找到自己需要的信息。网络内容挖掘技术的关键是对网络页面的分类及聚类。分类是指网络页面具有不同的特征,我们根据这些特征将网络页面划分为不同的类别;聚类是指,由于不同类别的网络页面之间或多或少都有着某种联系,我们将这些页面聚合到一起,形成不同的簇,尽可能使得同一个簇内的网络页面有着最为相近的内容,而不同簇之间的网络页面内容没有多大的相近性与关联度。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
jessie68us
2018-10-19 17:40:10
精彩!
网络数据挖掘是数据挖掘的一个重要分支,但是相比于数据挖掘,网络数据挖掘有着一些特殊之处。
网络大数据挖掘技术可以分为三类:
1. 网络结构挖掘
2. 网络内容挖掘
3. 网络应用挖掘
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
数据挖掘技术在经济统计中的应用探索
数据挖掘技术在医院科研信息服务中的应用探讨
数据挖掘技术在电信行业异常客户识别中的应用研究
基于数据挖掘技术的感染性腹泻的中医证候要素研究
数据挖掘技术及其在刑侦工作中的应用
基于数据挖掘技术下的气象预报研究
数据挖掘技术在人才绩效考评中的应用
运用数据挖掘技术探析脑缺血损伤电针作用机制的选穴规律
数据挖掘技术在温室作物生长预测中的应用
空间数据挖掘技术在土地定级估价中应用
栏目导航
休闲灌水
麦田创投
文献求助专区
经管文库(原现金交易版)
经管高考
商学院
热门文章
新宏观丨扩大内需的最大障碍是什么?
现代数学译丛14非线性最优化基础
【浙商证券】太空算力与商业航天行业专题报 ...
现代数学译丛10 调和分析基础教程
【华西证券】AI浪潮之基,电力价值与生态重 ...
物流运作基础 (英国皇家采购与供应学会(CI ...
2026年Stata初高级寒假班—AI赋能+原理+操作 ...
一文了解11种最常见的机器学习算法应用场景
CDA数据分析师实战核心:假设检验的逻辑、方 ...
CDA数据分析脱产就业班于2025年12月08日开班 ...
推荐文章
26年寒假天津站|Gemini论文写作&数据分析 ...
2026JG学术冬训营:从Stata初高到Python机器 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
几种免费下载文献的方法----我的文献应助经
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群