J'ai essayé OmniSci sur CentOS 7 + GeForce RTX 2080 Ti.

J'ai essayé OmniSci (anciennement MapD), qui est également un pionnier de la base de données SQL utilisant GPU, sur CentOS 7. J'ai utilisé un exemple de base de données appelé vols_2008_7M. Le GPU est le RTX 2080Ti 11 Go de PNY.

L'ordinateur de base utilise Core i5 7e génération, 16 Go de RAM DDR4, 2 To de SSD SATA cruciaux.

Comment installer OmniSci: https://docs.omnisci.com/v4.4.1/4_centos7-yum-gpu-ce-recipe.html C'est dedans.

Il contient 7 millions de données sur divers vols. Le cas où le modèle est un Boeing 777 ou 737 est extrait par l'instruction SQL.

Le code utilisé (Python 3) est:

omnisci-test.py


from pymapd import connect
import pandas as pd
import time

start = time.time()
con = connect(user="admin", password="PasswordHere", host="localhost", dbname="omnisci")
df = pd.read_sql("SELECT plane_model, uniquecarrier, deptime, arrtime from flights_2008_7M where plane_model like '777%' or plane_model like '737%' limit 1000", con)

print(df.to_string())

path = './omnisci-data.txt'

with open(path, 'w') as f:
        print(df.to_string(), file=f)
end = time.time()
print("Time elapsed: " + str(end - start))

Je mesure le temps d'exécution de deux recherches de préfixe LIKE ou, mais il était de 0,324 seconde car il est également écrit sur SSD. Cela faisait 0,2803 seconde lorsque j'ai mesuré la partie non écrite sur le SSD.

Résultat de l'exécution:


...
985     737-7H4            WN     1029     1126
986     737-7H4            WN     1720     1817
987     737-5H4            WN      754     1154
988     737-3H4            WN     1408     1511
989     737-7H4            WN     2039     2141
990     737-76Q            WN      622      813
991     737-5H4            WN     2125     2226
992     737-7H4            WN     2040     2156
993     737-3H4            WN      757      945
994     737-7H4            WN      641      739
995     737-3Q8            WN     1617     1903
996     737-3A4            WN     1304     1455
997     737-7H4            WN      737      843
998     737-7H4            WN     1952       42
999     737-5H4            WN     1729     1925
Time elapsed: 0.3249530792236328

J'ai essayé LIKE search comme un. (Boeing 777 uniquement)

partie df


df = pd.read_sql("SELECT plane_model, uniquecarrier, deptime, arrtime from flights_2008_7M where plane_model like '777%' limit 1000", con)

Le résultat ici était de 0,2931640148162842 secondes. (Avant d'écrire sur SSD)

L'écriture sur SSD était de 0,29114460945129395 secondes. Vous pouvez voir que la vitesse d'exécution ne change pas beaucoup avec seulement deux LIKE.

Tsubasa Kato PDG d'Inspire Search Co., Ltd.

Recommended Posts

J'ai essayé OmniSci sur CentOS 7 + GeForce RTX 2080 Ti.
J'ai essayé d'installer CentOS 8 sur ESXi 6.7
J'ai essayé de construire AdoptOpenjdk 11 sur CentOS 7
J'ai essayé de mettre Domino11 dans CentOS7
J'ai installé F-Revo CRM 7.3 sur CentOS 7.7
J'ai essayé d'utiliser Junit avec Mac VScode Maven
J'ai essayé de mettre facilement Java sur mon Mac
J'ai essayé d'installer docker sur une instance EC2
J'ai essayé d'exécuter Java dans un terminal Mac
J'ai essayé de démarrer avec Gradle sur Heroku
J'ai essayé Spring.
J'ai essayé de mettre Tomcat
J'ai essayé youtubeDataApi.
J'ai essayé de refactoriser ①
J'ai essayé FizzBuzz.
J'ai essayé JHipster 5.1
J'ai essayé d'utiliser Log4j2 sur un serveur Java EE
J'ai essayé d'utiliser YOLO v4 sur Ubuntu et ROS
J'ai installé CentOS 8 sur Windows 10 en utilisant VirtualBox et Vagrant
J'ai installé Squid sur CentOS dans mon environnement local