Essayez de gratter environ 30 lignes en Java (sortie CSV)

Qu'est-ce que le grattage?

Technologie logicielle informatique qui extrait des informations de sites Web. Il y a différentes zones grises lors du grattage, alors soyez prudent. Référence: Scraping and Law

Objectif

Je veux parler de ce que vous pouvez faire avec le grattage. Voici quelques exemples concrets

Il existe différentes manières de l'utiliser.

Code source

scraping.java


//Instruction d'importation omise
public class scraping {
    public static void main(String[] args){
        //Préparer le fichier
        PrintWriter p = null;
        try {
            p = new PrintWriter(new BufferedWriter(new OutputStreamWriter(new FileOutputStream("Chemin de destination de sortie/sample.csv"),"Shift-JIS")));
            //Spécifiez l'en-tête
            //Vous pouvez le changer librement ici
            //Si vous souhaitez ajouter plus de colonnes,Et ajoutez le nom de la colonne en tant qu'ensemble
                p.print("Colonne 1");
                p.print(",");
                p.print("Colonne 2");
                p.println();
            //Cette fois, je l'utilise comme clé de colonne
                int num = 1;
                Document document = Jsoup.connect("Cible URL").get();
                //Vous pouvez définir diverses choses telles que le nom de la classe, le nom de l'ID, le nom de la balise, etc.
                Elements elements = document.select("Élément cible");
                //Extraire lorsqu'il y a plusieurs éléments cibles
                for (Element element : elements) {
                    //Définir le contenu
                    p.print(num);
                    p.print(",");
                    p.print(element.text());
                    p.println();    //nouvelle ligne
                    num++;
                }
               
            } catch (IOException e) {
                    System.out.println(e);
            }finally {
                p.close();
            }
        System.out.println("Sortie du fichier terminée!");

    }
}

Méthode

document.select

Elements elements = document.select ("éléments cibles");

Pour l'élément cible

Peut être spécifié. Aussi,

Il existe également une méthode de spécification telle que la classe de nom de la balise p.

element.text

for (Element element : elements) { // définir le contenu p.print(num); p.print(","); p.print(element.text()); p.println (); // saut de ligne num++; }

--Le contenu peut être récupéré en utilisant la méthode text.

Résumé

En conséquence, le grattage pourrait être réalisé avec java dans environ 30. Personnellement, j'aime Java, alors je l'ai essayé.

Recommended Posts

Essayez de gratter environ 30 lignes en Java (sortie CSV)
À propos de la sortie du journal Java
Essayez d'utiliser RocksDB avec Java
Segfo Java en 6 lignes
Essayez de gratter en utilisant Java [Note]
Essayez d'appeler JavaScript en Java
Essayez de développer Spresense avec Java (1)
Essayez le type fonctionnel en Java! ①
Prend en charge 0 baisse dans la sortie CSV
À propos de la classe abstraite Java
Essayez d'implémenter Android Hilt en Java
Lire CSV en Java (annotation Super CSV)
Essayez d'exécuter Selenuim 3.141.59 avec eclipse (java)
Sortie mixte du calendrier occidental en Java
Essayez une expression If en Java
Enregistrer la sortie dans un fichier en Java
Essayez d'exécuter AWS X-Ray en Java
A propos du traitement de la copie de fichiers en Java
Essayez d'implémenter Yuma en Java
A propos du renvoi d'une référence dans un Java Getter
Essayez d'implémenter l'ajout n-aire en Java
Essayez d'utiliser l'API Stream en Java
[Création] Un mémorandum sur le codage en Java
Essayez d'utiliser l'API au format JSON en Java
Essayez d'appeler le service CORBA sur Java 11+
Date de sortie en Java au format étendu ISO 8601
À propos des enregistrements ajoutés pour l'aperçu dans Java JDK 14
Créons une application de calcul avec Java
Discussion continue sur l'écriture de Java avec Emacs @ 2018
À propos de la confusion observée dans les serveurs Java de démarrage
À propos de l'idée des classes anonymes en Java
Une histoire sur le JDK à l'ère de Java 11
Désérialiser le CSV en Java en fonction du nom de l'en-tête
Essayez de créer un babillard en Java
À propos de var utilisé en Java (type de variable locale)
Deuxième décoction: essayez une expression If en Java
Essayez d'utiliser Sourcetrail (version win) avec du code Java
Essayez d'utiliser l'API Cloud Vision de GCP en Java
Essayez d'utiliser Sourcetrail (version macOS) avec du code Java
J'ai essayé de sortir quatre-vingt-dix-neuf en Java
Essayez d'utiliser l'analyse syntaxique de l'API COTOHA en Java
[Java] Quelque chose est affiché comme "-0.0" dans la sortie
Comparez la sortie PDF en Java pour les tests d'instantanés
À propos de l'interface Java
[Java] À propos des fonctionnalités de Java 12
Partition en Java
[Java] À propos des tableaux
Essayez Java 8 Stream
Changements dans Java 11
Janken à Java
Quelque chose à propos de java
Où est Java
À propos des fonctionnalités Java
À propos des threads Java
Interface [Java]
À propos de la classe Java
À propos des tableaux Java
[Sortie] À propos de chaque
À propos de l'héritage Java