ICH, ~ März 2013 Abschluss an der Fakultät für Künste und Wissenschaften ~ April 2018 Infrastruktur SIer # Linux oder Azure Mai 2018-WEB-Ingenieur # Ich wollte mich entwickeln können Nach dem Übergang Ich studiere Java in einem hochgelobten Geschäft.
Wenn Sie lernen können, wie man sich entwickelt Ich möchte mein Bestes geben, damit ich Full-Stack-Fähigkeiten erwerben kann.
Es kann viele Anfängerbeschreibungen geben, aber wenn Sie die Ausgabe fortsetzen, Ich hoffe, dass sich Ingenieurfähigkeiten ansammeln.
Scraping einer bestimmten WEB-Seite Ich möchte auf den Suchbildschirm zugreifen (nach Schlüsselwörtern suchen und dann die Daten kratzen).
Ich möchte so darauf zugreifen,
Connection.Response response = Jsoup.connect(Url)
.headers(header)
.cookies(cookies)
.data(formData)
.timeout(3000)
.execute();
Die URL sieht so aus.
https://hoge.com/fuga.aspx?validation_no=123456789
Selbst wenn Sie so wie es ist darauf zugreifen, tritt natürlich ein Fehler auf. Ich bin nicht sicher, ob ich versuche, validation_no zu reinigen.
Nachdem ich mir ungefähr 6 Stunden Sorgen gemacht hatte, schaute ich mir die Entwicklertools an
https://hoge.com/fuga.aspx?validation_no=123456789
Auf der Seite (*), auf die Sie zuvor zugreifen, befindet sich ein Wort "Ort"! Beachten. Wenn ich nachschaue, scheint das Umleitungsziel angegeben zu sein. Das heißt, Sie müssen nicht an validation_no denken! ??
https://hoge.com/top.aspx
Einmal so
https://hoge.com/top.aspx
Verwenden Sie diese Option, um den unten angegebenen Standort abzurufen.
Connection.Response res = Jsoup.connect(Url)
.headers(header)
.timeout(3000)
.cookies(cookies)
.method(Connection.Method.GET)
.followRedirects(false)
.execute();
System.out.println(response.header("Location"));
Dann können Sie die URL mit validation_no erhalten, Verwenden Sie es, um das zu tun, was Sie tun möchten.
Wenn Sie es sich ansehen, können Sie es auf einen Schlag sehen, aber ich bin süchtig danach. .. ..
Referenz: https://stackoverflow.com/questions/16243455/capture-header-location-with-jsoup-or-other-html-parser
Ich habe Jsoup wieder an dem Ort getroffen, den ich erhalten habe. An erster Stelle
.followRedirects(true)
Es scheint, dass diese Existenz allein gut war.
Recommended Posts