(Mise à jour 2014.02.12 ajoutée à propos de la réinstallation de Boost et l'installation de PIL) (Mise à jour le 19 février 2014 Ajout du dessin de formule structurelle à l'aide du Caire) (Mis à jour le 11 mars 2014) Mise à jour du dessin de formule structurelle utilisant Cairo)
En tant qu'outil pour l'informatique chimique OpenBabel (C ++) et CDK (Java) sont réputés comme open sources, RDKit peut être utilisé en Python, il vous suffit donc d'écrire un script relativement simple C'est pratique car vous pouvez dessiner, rechercher et analyser des formules chimiques structurales.
Si vous utilisez Homebrew Python, n'oubliez pas de le mettre dans votre PATH avec .bash_profile etc.
Si NumPy n'est pas inclus, entrez-le.
pip install numpy
Volunteer Homebrew formura est ouvert au public, alors appuyez dessus et installez-le. https://github.com/edc/homebrew-rdkit
brew tap edc/homebrew-rdkit
brew install rdkit
Les modules dépendants cmake, wget, swig, boost et rdkit sont installés. L'installation de boost et rdkit prend un certain temps.
Si vous utilisez Homebrew Python, vous obtiendrez une erreur Fatal Python due à Boost. Générez Boost à partir des sources et réinstallez-le avec la commande suivante:
brew uninstall boost
brew install boost --build-from-source
A partir de la ligne de commande de rdkit import Chem Si vous le pouvez, l'installation est réussie.
PIL est nécessaire pour afficher les images de formule structurelle.
pip install pillow
Par exemple, le code suivant dessine une formule structurelle chimique à partir de SMILES et la renvoie au format PNG.
rdkittest.py
from rdkit import Chem
from rdkit.Chem import Draw
from rdkit.Chem import rdDepictor
mol = Chem.MolFromSmiles('CCC(CC)O[C@@H]1C=C(C[C@@H]([C@H]1NC(=O)C)[NH3+])C(=O)OCC')
rdDepictor.Compute2DCoords(mol)
Draw.MolToFile(mol, 'mol.png')
résultat:
Le code est extrêmement plus court que le CDK. Il semble que de nombreuses fonctions de calcul telles que le dessin, la recherche et l'analyse soient implémentées en C ++. Je ne pense pas que ce soit trop lent.
Cependant, comme vous pouvez le voir, la qualité d'image à ce stade est très mauvaise par rapport à CDK. Donc, dans mon cas, je recherche et analyse avec RDKit, et seul le dessin est lancé sur CDK.
Si Cairo et PyCairo sont disponibles (c'est-à-dire que l'importation du Caire est possible), la qualité de l'image sera considérablement améliorée car Cairo est automatiquement utilisé lors du dessin de la formule structurelle avec Draw.MolToFile ().
Le Caire et PyCairo peuvent être installés avec Homebrew.
brew install cairo
brew install py2cairo
(Pour Python2.7, c'est py2cairo au lieu de pycairo.) Lorsque Cairo est installé dans Homebrew, il entre en conflit avec le Caire par défaut de X11, donc je pense qu'il est probablement nécessaire de définir le chemin de la bibliothèque.
(Ajouté le 11.03.2014) Installez pango et pygtk.
brew install pango
brew install pygtk
Ce n'est pas grave si vous pouvez importer pango depuis Python. Cela améliorera la police et affichera l'indice du numéro atomique et l'indice ionique normalement.
Recommended Posts