[转载]Python(依赖mysql)爬虫||Perl入门||Perl爬虫动手(抓首页) ||JAVA构造器使用 - 经管之家

› 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › SQL及关系型数据库数据分析

[转载]Python(依赖mysql)爬虫||Perl入门||Perl爬虫动手(抓首页) ||JAVA构造器使用

9035

55

收藏 2015-02-09

1,两个小时学会perl

http://qntm.org/files/perl/perl.html

2，Python整站爬虫(Demo)(依赖Mysql)

本帖隐藏的内容

复制代码

3,JAVA构造器的实际使用package basic.day12;
public class User {
  String name;
  String pwd;
  int age;

public User(String name,String pwd,int age){
this.name=name;
this.pwd=pwd;
this.age=age;
  }
public String toString(){
return name+":"+age;
}
}

4,Perl爬虫动手(抓首页)
下面的代码目前只实现了抓取首页，后面会改下，要求抓2级到3级页面
#!/usr/bin/perl
use HTML::LinkExtor;
use LWP::Simple;
sub sparit{
  local($base_url)= shift;
  # 抓取URL
  $parser = HTML::LinkExtor->new(undef,$base_url);
  $parser->parse(get($base_url))->eof;
  @links = $parser->links;
  foreach $linkarray (@links){
   my @element = @$linkarray;
   my $elt_type = shift @element;
   while( @element){
   my ($attr_name , $attr_value) = splice(@element, 0, 2);
   $seen{$attr_value}++;
   }
  }
  # 排序/去除非同站URL
  for (sort keys %seen){
   if($_=~m#^$base_url#){
      push(@tmp_url,"$_\n");
   }
  }
  # 返回匹配的URL
  return @tmp_url;
}

5,Python字符串处理例子
#!/usr/bin/python
#coding=gb2312
line='aa,bb,cc,dd';
print line.split(',');
w='start';
s='wic\n';
print w.upper();
print w.isalpha();
print s.rstrip();
print '%s,caonima,de,%s' %('wo','b');
print '{0},caonima,de,{1}'.format('cao', 'nidaye');

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2015-2-9 11:35:55

感谢分享~~~~~~~~~~~~~~~~

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-2-9 20:24:01

[转载]Python(依赖mysql)爬虫||Perl入门||Perl爬虫动手(抓首页) ||JAVA构造器使用

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-2-14 17:40:13

有点想学python

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

愤怒的老鸟

2015-2-15 11:05:02

学习学习

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-2-15 15:24:08

1,两个小时学会perl 真的假的

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

依然似水流年

2015-2-16 21:55:36

谢谢楼主！谢谢分享！

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-2-19 16:49:05

支持饭团君

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-2-19 20:56:49

这个要支持

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-2-21 00:57:55

谢谢分享

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-2-26 11:18:23

学习了，谢谢分享

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-2-28 10:32:19

支持一下了

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-2-28 11:06:53

支持一下！

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-3-5 08:46:31

good, thank you

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-3-5 13:56:48

鼎力支持

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-3-6 10:42:05

没太懂Perl和Python的关系

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-3-6 22:48:45

不懂数据库的孩子飘过~

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-3-9 09:08:18

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

346807882@qq.co

2015-3-10 16:59:58

谢谢楼主分享PERL相关知识，对我非常有用。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-3-11 05:27:07

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-3-12 08:53:38

感谢楼主分享！！！

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-3-18 00:38:16

提示: 作者被禁止或删除内容自动屏蔽

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-3-21 20:58:43

多学习不错~~

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-3-26 21:56:28

good...

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-3-27 04:06:20

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-3-27 06:14:12

提示: 作者被禁止或删除内容自动屏蔽

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-4-2 11:34:47

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-4-4 18:23:15

{:2_31:}

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-5-31 17:01:09

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

2015-6-4 21:42:57

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

首页上一页下一页跳至第页

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群