|
@@ -28,8 +28,8 @@ public class Sex8Tool {
|
|
|
}
|
|
}
|
|
|
|
|
|
|
|
private static boolean mIsLoading;
|
|
private static boolean mIsLoading;
|
|
|
- // todo 每天爬取第二页前面5条
|
|
|
|
|
- private static int mCurrentPage = 50;
|
|
|
|
|
|
|
+ // todo 每天爬某一页的前面10条
|
|
|
|
|
+ private static int mCurrentPage = 2;
|
|
|
|
|
|
|
|
/**
|
|
/**
|
|
|
* 为了防止被百度拦截(人机识别),需要按F12查看浏览器的Header,设置相关属性
|
|
* 为了防止被百度拦截(人机识别),需要按F12查看浏览器的Header,设置相关属性
|
|
@@ -154,6 +154,11 @@ public class Sex8Tool {
|
|
|
// 爬完一个详情,歇一歇
|
|
// 爬完一个详情,歇一歇
|
|
|
justWait();
|
|
justWait();
|
|
|
index++;
|
|
index++;
|
|
|
|
|
+
|
|
|
|
|
+ // 抓够10条就收手
|
|
|
|
|
+ if (index > 10) {
|
|
|
|
|
+ break;
|
|
|
|
|
+ }
|
|
|
}
|
|
}
|
|
|
}
|
|
}
|
|
|
}
|
|
}
|
|
@@ -163,8 +168,9 @@ public class Sex8Tool {
|
|
|
}
|
|
}
|
|
|
|
|
|
|
|
// 爬完一页,页数要变化
|
|
// 爬完一页,页数要变化
|
|
|
- mCurrentPage--;
|
|
|
|
|
- return mCurrentPage != 0;
|
|
|
|
|
|
|
+ //mCurrentPage--;
|
|
|
|
|
+ //return mCurrentPage != 0;
|
|
|
|
|
+ return false;
|
|
|
}
|
|
}
|
|
|
|
|
|
|
|
private static String getTitle(Element docElement) {
|
|
private static String getTitle(Element docElement) {
|