Obtenez des taux de change réguliers avec Heroku et téléchargez des journaux sur Amazon S3

Construire un environnement de développement

Créer virtualenv

$ mkdir cronapp && cd cronapp
$ mkvirtualenv venv

Connectez-vous à Heroku

(venv)$ heroku login

Ajout de la bibliothèque Python

(venv)$ cat >> requirements.txt << EOF
APScheduler==3.0.4
awscli==1.9.11
boto3==1.2.2
botocore==1.3.11
colorama==0.3.3
docutils==0.12
futures==3.0.3
httplib2==0.9
jmespath==0.9.0
pyasn1==0.1.9
python-dateutil==2.4.2
pytz==2015.7
requests==2.8.1
rsa==3.2.3
six==1.10.0
tzlocal==1.2
wheel==0.26.0
EOF
(venv)$ pip install -r requirements.txt

Créer un script pour la vérification des opérations

(venv)$ vi cron.py

from apscheduler.schedulers.blocking import BlockingScheduler

sched = BlockingScheduler()

@sched.scheduled_job('interval', minutes=3)
def job_3min():
    print('[cron.py:job_3min] Start.')

sched.start()

Ajout de Procfile pour exécuter périodiquement le script créé

(venv)$ echo "bot: python cron.py" > Procfile

Ajouté .gitignore

(venv)$ cat >> .gitignore << EOF
venv
*.pyc
.idea
EOF

Créer un référentiel localement

(venv)$ git init && git add . && git commit -m "initial commit"

Déployer sur Heroku

Créer un référentiel dans Heroku

(venv)$ heroku create

Déployer l'application

(venv)$ git push heroku master

affectation de processus dyno

(venv)$ heroku ps:scale bot=1

Contrôle de fonctionnement

(venv)$ heroku logs
2015-12-07T01:36:20.343967+00:00 app[bot.1]: [cron.py:job_3min] Start.
2015-12-07T01:39:20.346373+00:00 app[bot.1]: [cron.py:job_3min] Start.
2015-12-07T01:42:20.344067+00:00 app[bot.1]: [cron.py:job_3min] Start.

Obtenez des données d'échange sur openexchangerates.org et téléchargez-les sur S3

Changement de cron.py au contenu suivant

Créez un utilisateur AWS IAM et obtenez à l'avance une clé API pour Open Exchange Rates.
Les données sur les taux de change ouverts sont mises à jour environ 1 à 2 minutes par heure, mais il est spécifié de s'exécuter régulièrement à 10 minutes par heure avec une marge.

import requests, json, datetime, pytz, logging
import boto3, botocore
from apscheduler.schedulers.blocking import BlockingScheduler

logging.basicConfig()
sched = BlockingScheduler()

@sched.scheduled_job('cron', minute='10', hour='*/1')
def job_crawl():
    print('[cron.py:job_crawl] Start.')
    
    ####################################
    # API Keys
    ####################################

    OPEN_EXCHANGE_API_URL = 'https://openexchangerates.org/api/latest.json?app_id='
    OPEN_EXCHANGE_APP_ID = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'

    AWS_ACCESS_KEY_ID = 'xxxxxxxxxxxxxxxx'
    AWS_SECRET_ACCESS_KEY = 'xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
    AWS_REGION_NAME = 'xx-xxxxx-x'
    AWS_S3_BUCKET_NAME = 'xxxxxxxxxxx'

    ####################################
    # Retrieve json data from openexchangerates.com
    ####################################

    res = requests.get(OPEN_EXCHANGE_API_URL + OPEN_EXCHANGE_APP_ID)
    json_data = json.loads(res.text.decode('utf-8'))
    del json_data['disclaimer']
    del json_data['license']
    json_text = json.dumps(json_data)

    timestamp = json_data['timestamp']
    exchange_date = datetime.datetime.fromtimestamp(timestamp, tz=pytz.utc)

    ####################################
    # Upload json data to S3 bucket
    ####################################

    if json_text:

        #
        # AWS Session
        #
        session = boto3.session.Session(aws_access_key_id=AWS_ACCESS_KEY_ID,
                                        aws_secret_access_key=AWS_SECRET_ACCESS_KEY,
                                        region_name=AWS_REGION_NAME)
        s3 = session.resource('s3')
        bucket = s3.Bucket(AWS_S3_BUCKET_NAME)

        #
        # Upload Latest
        #
        bucket_latest_key_name = 'exchange/latest.json'
        obj = bucket.Object(bucket_latest_key_name)
        response = obj.put(
            Body=json_text.encode('utf-8'),
            ContentEncoding='utf-8',
            ContentType='application/json'
        )

        #
        # Upload Daily Data
        #
        bucket_prefix_daily = "{0:%Y-%m-%d}".format(exchange_date)
        bucket_daily_key_name = 'exchange/' + bucket_prefix_daily + '/' + bucket_prefix_daily + '.json'
        obj = bucket.Object(bucket_daily_key_name)
        response = obj.put(
            Body=json_text.encode('utf-8'),
            ContentEncoding='utf-8',
            ContentType='application/json'
        )

        #
        # Upload Hourly Data
        #
        bucket_hourly_prefix = "{0:%Y-%m-%d-%H}".format(exchange_date)
        bucket_hourly_key_name = 'exchange/' + bucket_prefix_daily + '/' + bucket_hourly_prefix + '.json'
        try:
            # If json file already exists, do nothing
            s3.Object(AWS_S3_BUCKET_NAME, bucket_hourly_key_name).load()
        except botocore.exceptions.ClientError as e:
            # If json file doesn't exists
            obj = bucket.Object(bucket_hourly_key_name)
            response = obj.put(
                Body=json_text.encode('utf-8'),
                ContentEncoding='utf-8',
                ContentType='application/json'
            )

    print('[cron.py:job_crawl] Done.')


sched.start()

Déployer pour refléter le contenu mis à jour

(venv)$ git add . && git commit -m "changed cron job"
(venv)$ git push heroku master

Contrôle de fonctionnement

(venv)$ heroku logs
2015-12-07T03:10:00.003862+00:00 app[bot.1]: [cron.py:job_crawl] Start.
2015-12-07T03:10:01.856428+00:00 app[bot.1]: [cron.py:job_crawl] Done.

prime

Renommer l'application

(venv)$ heroku apps:rename cronapp

Changer de référentiel

(venv)$ git remote rm heroku
(venv)$ heroku git:remote -a cronapp

Obtenez des taux de change réguliers avec Heroku et téléchargez des journaux sur Amazon S3

Construire un environnement de développement

Créer virtualenv

Connectez-vous à Heroku

Ajout de la bibliothèque Python

Créer un script pour la vérification des opérations

Ajout de Procfile pour exécuter périodiquement le script créé

Ajouté .gitignore

Créer un référentiel localement

Déployer sur Heroku

Créer un référentiel dans Heroku

Déployer l'application

affectation de processus dyno

Contrôle de fonctionnement

Obtenez des données d'échange sur openexchangerates.org et téléchargez-les sur S3

Changement de cron.py au contenu suivant

Déployer pour refléter le contenu mis à jour

Contrôle de fonctionnement

prime

Renommer l'application

Changer de référentiel

Site de référence