经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
数据分析与数据挖掘
小数据也能创造财富-数据挖掘的应用(1)
楼主
挖掘数据的老鼠
1418
2
收藏
2013-12-29
原帖地址:
http://blog.sina.com.cn/s/blog_7387c96a0101pq17.html
数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。
其应用非常广泛,哪里有大数据哪里就有数据挖掘。
其实只要我们有数据挖掘的思维,即使是小数据,同样可以挖掘出有意思的东西,大大提高我们的学习和工作效率。
在这里我很想和大家交流一下数据挖掘在学习意大利语
远过去时态
中的应用。
意大利语远过去时
:通常表示比较遥远的过去发生的动作,也表示跟现在没有密切关系的过去发生的并应经完成的动作。
远过去时态(Passato Remoto)的动词变位分为规则和不规则:
部分远过去时不规则的动词变位第一人称如下:
第一个外语单词是动词原形,第二个外语单词是这个动词的远过去时不规则的动词变位的第一人称形式。
(在这里我主要是和大家交流数据挖掘的思路,而不是教意大利语,所以就不再讨论其他人称形式。)
rimanere停留: rimasti
nascere出生: nacqui
vivere生活: vissi
cadere掉,落: caddi
correre跑: corsi
crescere生长: crebbi
dipendere依靠: dipesi
esplodere爆炸: esplosi
evadere逃离:evasi
giungere到达: giunsi
scendere: scesi
sorgere升起:sorsi
accorgersi发现:mi accorsi
dolersi抱怨:mi dolsi
valere价值:valsi
parere似乎: parvi
leggere: lessi
scrivere: scrissi
rompere打碎: ruppi
corrompere: corromppi
interrompere: interromppi
irrompere: irromppi
prorompere: proromppi
sapere: seppi
tenere: tenni
vedere: vidi
volere: volli
accendere点燃: accesi
accludere附上: acclusi
decidere: decisi
tacere沉默: tacqui
piacere: piacqui
mettere: misi
appendere挂: appesi
discutere讨论: discussi
cogliere采集: colsi
ardere点燃: arsi
assolvere释放: assolsi
assumere承担:assunsi
bere: bevvi
chiedere: chiesi
chiudere: chiusi
cingere(围): cinsi
stringere(握紧): strinsi
fingere(假装): finsi
vincere战胜: vinsi
volgere转向: volsi
conoscere: conobbi
perdere失去: persi
servire: servii
dire: dissi
venire: venni
这只是我们面临的部分数据(我们这次研究的全部数据和Bigdata相比是属于非常小的数据:10M都不到),但是要记住它们的话,记忆量很大而且很容易忘记。有没有什么办法挖掘出有用的信息呢?
记忆陌生的东西的好办法:通过熟悉的东西记忆。例如:一个叫李民的人做自我介绍:李世民的李,李世民的民。这样比他直接告诉别人他叫李民要好记的得多。
因此数据挖掘的思路有了:这些数据是否和已经熟知的东西有关联呢?
在意大利语法中还有现在时态,一般过去时态,现在完成时态等等是学习意大利语必须掌握的时态。
这个远过去时态会不会和已经熟悉的现在时态,一般过去时态(passato prossimo),现在完成时态等的动词变位有关联呢?
把这些数据导入挖掘工具,运用关联分析,我们发现:如果一个动词的一般过去时态(passato prossimo)是不规则的很可能它的远过去时态
(Passato Remoto)也是不规则的。
再经过分析,发现两种不规则变化还很类似。
这个发现对于一个正在学习意大利远过去时态的学生来说是非常有用的!
他可以通过他熟知的
这个动词的
一般过去时态(passato prossimo)是否规则迅速
判断它的远过去时态是否规则,并可以根据我们挖掘到下面的规则迅速得出
这个动词的远过去时的第一人称是怎样的。
通过这种方式可以迅速建立学习的信心,并在练习中不断强化记忆,达到事半功倍的效果。
我们挖掘到的:
总结
远过去时态
(Passato Remoto)不规则常用动词变化规则
如下:第一列为分类,第二列为动词原形,第三列为
一般过去
时态(passato prossimo),第四列为
远过去时态
(Passato Remoto)
第一类(tipo1)
: 有8个常用动词有这样的规则,如果动词的
一般过去
时态(passato prossimo)不规则变化而且是以
sso结尾
那么它的
远过去时态
(Passato Remoto)很可能也是不规则的而且它的第一人称以
ssi
结尾。
第二类(tipo2)
: 有10个
常用
动词有这样的规则,如果动词的
一般过去
时态(passato prossimo)不规则变化而且是以
tto
结尾
那么它的
远过去时态
(Passato Remoto)很可能也是不规则的而且它的第一人称以
ssi
结尾。
第三类(tipo3)
: 有19个
常用
动词有这样的规则,如果动词的
一般过去
时态(passato prossimo)不规则变化而且是以
so结尾
那么它的
远过去时态
(Passato Remoto)很可能也是不规则的而且它的第一人称以
si
结尾。
第四类(tipo4)
: 有21个
常用
动词有这样的规则,如果动词的
一般过去
时态(passato prossimo)不规则变化而且是以
t
o结尾
那么它的
远过去时态
(Passato Remoto)很可能也是不规则的而且它的第一人称以
si
结尾。
第五类(tipo5)
: 有3个
常用
动词有这样的规则,如果动词的
一般过去
时态(passato prossimo)不规则变化而且是
实际上以上五类属于同一大类
第六类(tipo6)
和
第七类(tipo7)
和上面这五不一样,但是只有13个常用动词属于第六类第七类
因此:对业务的熟悉程度,对数据的敏锐度是非常重要的。如果只知道挖掘工具的使用而不知道如何挖掘,就好像一个对photoshop使用熟练但是对美术一窍不通的人,是很难用photoshop进行原创设计的。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
baiyongbin1298
2013-12-30 09:33:25
文本挖掘?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
celon
2013-12-30 17:40:43
学习了
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
[下载]数据挖掘管理系统规范说明
[推荐]一本关于纠正数据挖掘中错误数据的书
数据之舞:大数据与数据挖掘
电信业务数据挖掘详细报告.ppt
数据挖掘学科的实用框架
数据挖掘
唐汉钧治疗甲状腺癌术后医案的数据挖掘
数据挖掘及其工具的选择
数据挖掘中统计方法的作用和问题点
数据挖掘的研究与应用
栏目导航
数据分析与数据挖掘
哲学与心理学版
爱问频道
经管文库(原现金交易版)
组织管理与领导力
真实世界经济学(含财经时事)
热门文章
初等数学论丛 第3辑
2026六大未来产业发展趋势与人工智能八大落 ...
A Course in Real Analysis (Textbooks in ...
财报掘金
2025中国城市地下空间发展蓝皮书
高观点下的初等数学概念+沈钢编著,2001
当AI遇见ML:高校教师如何借助AI与机器学习 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
AI Core产业营销思考
CDA数据分析师实战:指标体系搭建的全流程方 ...
推荐文章
12月武汉站|Deepseek辅助论文写作与数据分 ...
2026JG学术冬训营:从Stata初高到Python机器 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
几种免费下载文献的方法----我的文献应助经
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群