[RUBY] Wir haben eine Ranking-Site für Geschäftsbücher und praktische Bücher erstellt, die auf Informationen wie Notizen basiert.

Einführung

Wir haben eine Ranking-Site erstellt, indem wir die Amazon-Produkte zusammengefasst haben, die aus den in den Notizen veröffentlichten Artikeln verlinkt wurden. Es gibt einen Tech Book Rank basierend auf Qiita für das Ranking von technischen Büchern, aber ich möchte Geschäftsbücher und praktische Bücher lesen. Wenn es sich also um ein Notizbuch handelt, ist dies der Fall. Ich dachte, es gäbe Informationen.

Note Station | Beliebte Geschäftsbücher, praktische Bücher und technische Bücher werden täglich im Ranking-Format aktualisiert

image.png

Ursprünglich habe ich es für den persönlichen Gebrauch, als Referenz für den Kauf von Büchern und als Studie zur Ranking-Verarbeitung erstellt, aber ich habe beschlossen, es zu veröffentlichen, weil ich dachte, es wäre bequemer als erwartet.

Da es viele Buchkategorien gibt, ist es möglich, nach Kategorieinformationen bis zur zweiten Ebene zu filtern. Wenn die Amazon-Kategorie bis zum Ende angezeigt wird, ist sie sehr gut, sodass die Auflösung grob ist.

Da andere Informationen als Bücher herauskommen, versuche ich, sie so anzuzeigen, wie sie sind, ohne zu filtern.

Was du nicht kannst

Obwohl es als TODO zusammengefasst ist, möchte ich hauptsächlich den Ranking-Bereich verbessern.

Insbesondere versuche ich, die Tatsache zu verwalten, dass Kindle- und physische Bücher getrennt behandelt werden. Ich habe bereits die Informationen zur Namensidentifikation, aber da die Punktzahl von MySQL berechnet wird, mache ich mir Sorgen, dass die Abfrage sehr schwer wird, wenn ich den Prozess zur Namensidentifikation einbeziehe.

Außerdem möchte ich die Einschränkung des Entdeckungsbereichs bewältigen, da die Top-Rankings von Monaten und Jahren ähnlich sind.

Danach werden in einem Artikel auch andere Bücher vorgestellt, daher möchte ich verwandte Bücher zusammen mit der Ranglistenanzeige anzeigen. Selbst bei Amazon können verwandte Produkte nur auf jeder Seite zurückverfolgt werden. Wenn Sie also verwandte Produkte in einer kleinen Größe in der Listenanzeige anzeigen, können Sie das Gefühl haben, als würden Sie ein Bücherregal in einem Buchladen betrachten.

Über das Ranking

Ich bin kein Experte, daher kann ich keine schwierigen Theorien und Prozesse implementieren, aber ich habe Folgendes beachtet.

Sie können ein Buch wie dieses sehen.

month.jpg

Liste der verwendeten Technologien

Die Technologie, die ich benutze, ist nichts Neues. Ich wollte es mit SPA machen, aber da es nur eine Seite gibt, habe ich es klassisch gemacht. Ich studiere auch, also denke ich darüber nach, es bald zum SPA zu machen.

Ich möchte nicht so viel Geld wie möglich ausgeben, deshalb verwende ich Conohas VPS anstelle von AWS oder GCP.

Der Server, der crawlt und aggregiert, und der Server, der Ranginformationen verteilt, werden jedoch getrennt. Ranking-Informationen werden einmal am Tag generiert und die Website verfügt nicht über eine Schreibverarbeitung. Nachdem die generierten Ranking-Informationen in MySQL generiert wurden, werden sie als SQLite-Datei ausgegeben und für die Website an VPS übertragen. (Da die Daten vor der Aggregation eine große Anzahl von Datensätzen und eine große Datengröße unter MySQL sind, möchte ich nicht darauf verweisen.)

Das Speichern von Ranking-Informationen an SQLite erfolgt, weil die Anzahl der Datensätze gering ist. Dies reduziert jedoch die Speichernutzung und die Festplattennutzung und kann mit einem kleinen VPS betrieben werden. Im Moment denke ich, dass es ziemlich gut funktioniert (die Reaktionszeit beträgt weniger als 50 Millisekunden).

Ich möchte, dass du es einmal versuchst.

Note Station | Beliebte Geschäftsbücher, praktische Bücher und technische Bücher werden täglich im Ranking-Format aktualisiert

Recommended Posts

Wir haben eine Ranking-Site für Geschäftsbücher und praktische Bücher erstellt, die auf Informationen wie Notizen basiert.
Erstellt ein Docker-Container-Image für einen OpenLDAP-Server basierend auf Fedora