[JAVA] Analysieren Sie die umgeleitete Seite (Jsoup verwendet den Standort zum Übergang des Bildschirms).

Einführung

ICH, ~ März 2013 Abschluss an der Fakultät für Künste und Wissenschaften ~ April 2018 Infrastruktur SIer # Linux oder Azure Mai 2018-WEB-Ingenieur # Ich wollte mich entwickeln können Nach dem Übergang Ich studiere Java in einem hochgelobten Geschäft.

Wenn Sie lernen können, wie man sich entwickelt Ich möchte mein Bestes geben, damit ich Full-Stack-Fähigkeiten erwerben kann.

Es kann viele Anfängerbeschreibungen geben, aber wenn Sie die Ausgabe fortsetzen, Ich hoffe, dass sich Ingenieurfähigkeiten ansammeln.

Was ich machen wollte

Scraping einer bestimmten WEB-Seite Ich möchte auf den Suchbildschirm zugreifen (nach Schlüsselwörtern suchen und dann die Daten kratzen).

Ich möchte so darauf zugreifen,

Connection.Response response = Jsoup.connect(Url)
        .headers(header)
        .cookies(cookies)
        .data(formData)
        .timeout(3000)
        .execute();

Die URL sieht so aus.

https://hoge.com/fuga.aspx?validation_no=123456789

Selbst wenn Sie so wie es ist darauf zugreifen, tritt natürlich ein Fehler auf. Ich bin nicht sicher, ob ich versuche, validation_no zu reinigen.

Nachdem ich mir ungefähr 6 Stunden Sorgen gemacht hatte, schaute ich mir die Entwicklertools an

https://hoge.com/fuga.aspx?validation_no=123456789

Auf der Seite (*), auf die Sie zuvor zugreifen, befindet sich ein Wort "Ort"! Beachten. Wenn ich nachschaue, scheint das Umleitungsziel angegeben zu sein. Das heißt, Sie müssen nicht an validation_no denken! ??

https://hoge.com/top.aspx

Was ich getan habe

Einmal so

https://hoge.com/top.aspx

Verwenden Sie diese Option, um den unten angegebenen Standort abzurufen.

Connection.Response res = Jsoup.connect(Url)
        .headers(header)
        .timeout(3000)
        .cookies(cookies)
        .method(Connection.Method.GET)
        .followRedirects(false)
        .execute();

System.out.println(response.header("Location"));

Dann können Sie die URL mit validation_no erhalten, Verwenden Sie es, um das zu tun, was Sie tun möchten.

Am Ende

Wenn Sie es sich ansehen, können Sie es auf einen Schlag sehen, aber ich bin süchtig danach. .. ..

Referenz: https://stackoverflow.com/questions/16243455/capture-header-location-with-jsoup-or-other-html-parser

Nachtrag (2018/6/18)

Ich habe Jsoup wieder an dem Ort getroffen, den ich erhalten habe. An erster Stelle

        .followRedirects(true)

Es scheint, dass diese Existenz allein gut war.

Recommended Posts

Analysieren Sie die umgeleitete Seite (Jsoup verwendet den Standort zum Übergang des Bildschirms).
Ich möchte im gespeicherten Zustand zum selben Bildschirm wechseln
[Schienen] So verhindern Sie den Bildschirmübergang
So wechseln Sie die Anzeige des Header-Menüs für jede Übergangsseite
So übergeben Sie den Wert an einen anderen Bildschirm
Korrigieren Sie den Ansichtsbildschirm der Beitragsseite
[Fehler] So beheben Sie das Phänomen, dass der Bildschirm nach der Bearbeitung nicht wechselt