求助: [img]file:///C:\Users\Administrator\AppData\Roaming\Tencent\Users\289997150\QQ\WinTemp\RichOle\YMO[0Y_Y1[T0K[1]0]0]QNN.png[/img][img]file:///C:\Users\Administrator\AppData\Roaming\Tencent\Users\289997150\QQ\WinTemp\RichOle\YMO[0Y_Y1[T0K[1]0]0]QNN.png[/img]北大语料库检索“北京”出来的结果,共有308302条:http://ccl.pku.edu.cn:8080/ccl_corpus/search?q=%E5%8C%97%E4%BA%AC&start=0&num=50&index=FullIndex&outputFormat=HTML&encoding=UTF-8&maxLeftLength=30&maxRightLength=30&orderStyle=score&LastQuery=&dir=xiandai&scopestr=
之前用R下的readline()函数和正则表达式爬过数据,但爬这个网站显示403错误,试下别的网站都可以。昨天试了一天,还是没弄出来。由于查询的关键字太多,赶着写论文,所以请教下论坛的大神们,小白感激不尽!
附件列表