Explorar o código

爬虫计划就绪

詹子聪 %!s(int64=5) %!d(string=hai) anos
pai
achega
26b571b412
Modificáronse 1 ficheiros con 10 adicións e 4 borrados
  1. 10 4
      src/main/java/com/miekir/shibei/tool/web/Sex8Tool.java

+ 10 - 4
src/main/java/com/miekir/shibei/tool/web/Sex8Tool.java

@@ -28,8 +28,8 @@ public class Sex8Tool {
     }
 
     private static boolean mIsLoading;
-    // todo 每天爬取第二页前面5
-    private static int mCurrentPage = 50;
+    // todo 每天爬某一页的前面10
+    private static int mCurrentPage = 2;
 
     /**
      * 为了防止被百度拦截(人机识别),需要按F12查看浏览器的Header,设置相关属性
@@ -154,6 +154,11 @@ public class Sex8Tool {
                         // 爬完一个详情,歇一歇
                         justWait();
                         index++;
+
+                        // 抓够10条就收手
+                        if (index > 10) {
+                            break;
+                        }
                     }
                 }
             }
@@ -163,8 +168,9 @@ public class Sex8Tool {
         }
 
         // 爬完一页,页数要变化
-        mCurrentPage--;
-        return mCurrentPage != 0;
+        //mCurrentPage--;
+        //return mCurrentPage != 0;
+        return false;
     }
 
     private static String getTitle(Element docElement) {