全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 MATLAB等数学软件专版
4246 8
2017-01-17
准备寒假自学MATLAB爬虫,建一个帖子分享自己找到的程序和心得

附:[url=]函数regexp用法[/url]
附件列表

MATLAB爬虫1.zip

大小:958 Bytes

只需: 100 个论坛币  马上下载

不要下载这个,我不知道怎么删

本附件包括:

  • DataRetrieval.m

DataRetrieval.zip

大小:2.04 KB

只需: 1 个论坛币  马上下载

本附件包括:

  • DataRetrieval1.m
  • DataRetrieval2.m

函数regexp.pdf

大小:890.14 KB

只需: 1 个论坛币  马上下载

函数用法

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-1-17 14:08:56
warning off
关闭MATLAB的警告提醒
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-1-17 14:33:06


函数urlread: Download URL content to character vector. Urlread is not recommended. Use webread or webwrite instead.   (webread和webwrite是MATLAB的新增功能)
str = urlread(URL)
str = urlread(URL, Name, Value)
URL:网页地址,NAME:get或是post,Value:要向网页传递的参数。

一般中文网页的网页编码是'GBK',调用语法是:
S=urlread('http://sina.com.cn','get','','GBK')

example1:
fullURL = ['http://www.mathworks.com/matlabcentral/fileexchange', '?term=urlread'];
str = urlread(fullURL);
urlread从指定的URL读取并将HTML内容下载到字符向量str。
example2:
Download Web Content Related to Term
URL = 'http://www.mathworks.com/matlabcentral/fileexchange';
str = urlread(URL,'Get',{'term','urlread'});
urlread从http://www.mathworks.com/matlabcentral/fileexchange/?term=urlread中读取,并将HTML内容下载到字符向量str。
example3:
fullURL = ['http://www.mathworks.com/matlabcentral/fileexchange', '?term=urlread'];
str = urlread(fullURL,'Timeout',5);



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-1-17 17:37:31
函数fprintf:fprintf('Juhi = %d',17);

uses the decimal notation format (%d) to display the variable 17.


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-1-17 21:13:33
函数regex:- 匹配正则表达式(区分大小写)[out1,...,outN] = regexp(str,expression,outkey1,...,outkeyN)


查找以c开头、 以t,结尾,包含它们之间的一个或多个元音的单词。

str = 'bat cat can car coat court CUT ct CAT-scan';

expression = 'c[aeiou]+t';
startIndex = regexp(str,expression)
startIndex =     5    17

正则表达式'c[aeiou]+t'指定这种模式︰

  • c必须是第一个字符。


  • c后面必须有一个括号, [aeiou]字符.


  • 括号内的模式必须出现一个或更多的时间,如+运算符。


  • t必须是最后一个字符,不置于括号内的模式和t之间的字符.


在startIndex值指示匹配正则表达式的每个单词的第一个字符的索引。匹配单词cat在索引 5,及coat开始索引 17 处。因为他们是大写不匹配的话,CUT和CAT。





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-1-19 09:44:20
寒假跟你学,期待后续
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群