全部版块 我的主页
论坛 数据科学与人工智能 人工智能 语音识别
726 1
2024-06-29
自然语言处理(NLP)的一个最伟大的方面是跨越多个领域的计算研究,从人工智能到计算语言学的多个计算研究领域都在研究计算机与人类语言之间的相互作用。它主要关注计算机如何准确并快速地处理大量的自然语言语料库。什么是自然语言语料库?它是用现实世界语言表达的语言学习,是从文本和语言与另一种语言的关系中理解一组抽象规则的综合方法。

人类语言是抽象的信息符号,其中蕴含着丰富的语义信息,人类可以很轻松地理解其中的含义。而计算机只能处理数值化的信息,无法直接理解人类语言,所以需要将人类语言进行数值化转换。不仅如此,人类间的沟通交流是有上下文信息的,这对于计算机也是巨大的挑战。

一、自然语言处理的流程逻辑
数据收集和预处理:获取和清洗原始语言数据,包括文本、语料库或语音数据;
分词和词法分析:将原始文本数据转换为适合模型输入的格式,如分词、去除停用词、词干提取等。
特征提取:将文本转换为计算机可以处理的向量形式,如词向量表示、句子向量表示等。常用的特征提取方法包括词袋模型、TF-IDF、词嵌入等。
模型训练:利用训练数据集,采用机器学习或深度学习方法训练自然语言处理模型。
模型评估:使用验证数据集评估模型的性能,如准确率、召回率、F1值等指标。
模型应用:将训练好的模型应用于实际问题,如文本分类、情感分析、机器翻译等任务。

二、NLP 的5个难点
1.语言的多样性:语言是没有规律的,或者说规律是错综复杂的。
2.语言的歧义性:语言是可以自由组合的,可以组合复杂的语言表达。
3.语言的鲁棒性:语言是一个开放集合,我们可以任意的发明创造一些新的表达方式。
4.语言的知识依赖:语言需要联系到实践知识,有一定的知识依赖。
5.语言的上下文:语言的使用要基于环境和上下文。

三、NLP 的未来发展方向
1、语音助手
语音助手是自然语言处理( NLP )技术的重要应用之一,它使用 NLP 技术来理解用户的语音指令和自然语言提问,并做出相应的回应和操作。
2、自动文本摘要
自动文本摘要是自然语言处理( NLP )技术的一种应用,它可以将一篇较为冗长的文章摘要成一段较为简洁明了的内容,便于人们快速浏览和理解。
3、情感分析
情感分析( Sentiment Analysis )是一种自然语言处理技术,它可以自动识别文本中的情感倾向,例如正向、负向或中性。
4、机器翻译
机器翻译( Machine Translation )是自然语言处理( NLP )技术中的一项重要应用。它指使用计算机程序将一种自然语言的文本转化为另一种自然语言的文本。
5、自然语言生成
自然语言生成( Natural Language Generation )是自然语言处理( NLP )技术中的一项重要应用,它指通过计算机程序将结构化数据转化为自然语言的文本。

四、NLG 的6个步骤:
1、内容确定 – Content Determination
2、文本结构 – Text Structuring
3、句子聚合 – Sentence Aggregation
4、语法化 – Lexicalisation
5、参考表达式生成 – Referring Expression Generation|REG
6、语言实现 – Linguistic Realisation

五、NLP类别
1、文本挖掘:主要包含了文本的分类、聚类、信息抽取、摘要、情感分析以及对挖掘的信息和知识的可视化、交互式的呈现界面,这些统称为文本挖掘任务。
2、信息检索:对大规模文档进行索引。可简单对文档中的词汇,赋予不同的权重来建立索引,也可以使用算法来建立更深层的索引。查询时,首先对输入进行分析,然后在索引里面查找匹配的候选文档,再根据一个排序机制把候选文档排序,最后输出排序得分最高的文档。
3、句法语义分析:针对目标句子,进行各种句法分析,如分词、词性标记、命名实体识别及句法分析、语义角色识别和多义词消歧等。
4、机器翻译:随着通信技术与互联网技术的飞速发展、信息的急剧增加以及国际联系愈加紧密,让世界上所有人都能跨越语言障碍获取信息的挑战已经超出了人类翻译的能力范围。

六、NLP 与人工智能
NLP 是计算机领域与人工智能领域中的一个重要分支 人工智能( Artificial Intelligence, AI)在1955 年达特茅斯特会议上被提出,而后人工智能先后经历了三次浪潮,但是在20世纪70年代第一次 AI 浪潮泡沫破灭之后,这一概念迅速进入沉寂,相关研究者都不愿提起自己是研究人工智能的,转而研究机器学习、数据挖掘、 自然语言处理等各个方向 1990 年迎来第二次黄金时代 ,同期日本意欲打造传说中的“第五代计算机”,日本当时宣称第五代计 机的能力就是能够自主学习,而随着第五代计算机研制的失败,人工智能再次进入沉寂期。2008年左右,由于数据的大幅增强、计算力的大幅提升、深度学习实现端到端的训练,深度学习引领人工智能进入第三波浪潮 人们也逐渐开始将如日中天的深度学习方法引人到 NLP 领域中 在机器翻译、问答系统 自动摘要等方向取得成功。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2024-6-29 22:08:00
学习地址:https://pan.baidu.com/s/16b3BqU_zN_zYngLLrW6FJQ 提取码:yjeg
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群