全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SQL及关系型数据库数据分析
8665 55
2015-02-09

1,两个小时学会perl

http://qntm.org/files/perl/perl.html


2,Python整站爬虫(Demo)(依赖Mysql)

本帖隐藏的内容

复制代码




3,JAVA构造器的实际使用package basic.day12;
public class User {
  String name;
  String pwd;
  int age;
  
public User(String name,String pwd,int age){
    this.name=name;
    this.pwd=pwd;
    this.age=age;
  }
public String toString(){
   return name+":"+age;
}
}


4,Perl爬虫动手(抓首页)
下面的代码目前只实现了抓取首页,后面会改下,要求抓2级到3级页面
#!/usr/bin/perl
use HTML::LinkExtor;
use LWP::Simple;
sub sparit{
  local($base_url)= shift;
  # 抓取URL
  $parser = HTML::LinkExtor->new(undef,$base_url);
  $parser->parse(get($base_url))->eof;
  @links = $parser->links;
  foreach $linkarray (@links){
     my @element = @$linkarray;
     my $elt_type = shift @element;
     while( @element){
       my ($attr_name , $attr_value) = splice(@element, 0, 2);
       $seen{$attr_value}++;
     }
  }
  # 排序/去除非同站URL
  for (sort keys %seen){
       if($_=~m#^$base_url#){
          push(@tmp_url,"$_\n");
       }
  }
  # 返回匹配的URL
  return @tmp_url;
}


5,Python字符串处理例子
#!/usr/bin/python
#coding=gb2312
line='aa,bb,cc,dd';
print line.split(',');
w='start';
s='wic\n';
print w.upper();
print w.isalpha();
print s.rstrip();
print '%s,caonima,de,%s' %('wo','b');
print '{0},caonima,de,{1}'.format('cao', 'nidaye');


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-2-9 11:35:55
感谢分享~~~~~~~~~~~~~~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-9 20:24:01
[转载]Python(依赖mysql)爬虫||Perl入门||Perl爬虫动手(抓首页) ||JAVA构造器使用
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-14 17:40:13
有点想学python
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-15 11:05:02
学习学习
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-2-15 15:24:08
1,两个小时学会perl          真的假的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群