Ici, nous expliquerons RDKit, indispensable pour la chimioinfomatique. Je vais résumer la méthode de base en utilisant Python.
Pour utiliser RDKit, il est recommandé d'installer Anaconda et de l'installer avec conda
.
$ conda install -c rdkit rdkit
Lors de son utilisation, importez-le comme suit.
from rdkit import Chem
Par exemple, pour enregistrer la structure du composé affiché dans SMILES sous forme de fichier png:
from rdkit import Chem
molecule = Chem.MolFromSmiles(Sourires composés)
Chem.Draw.MolToFile(molecule, 'nom de fichier.png')
Vous pouvez également le créer à partir d'un fichier mol.
from rdkit import Chem
molecule = Chem.MolFromMolFile(Fichier mol du composé)
Chem.Draw.MolToFile(molecule, 'nom de fichier.png')
Pour calculer le descripteur du composé lu par SMILES:
from rdkit import Chem
from rdkit.ML.Descriptors import MoleculeDescriptors
smiles_list = [Liste des SMILES des composés cibles]
target_descriptors = []
for desc in Chem.Descriptors.descList:
target_descriptors.append(desc[0]) #desc est un tuple de noms de descripteurs et d'informations associées.
print(len(target_descriptors))
print(target_descirptors)
descriptor_calculator = MoleculeDescriptors.MolecularDescriptorCalculator(target_descriptors)
descriptors = []
for smiles in smiles_list:
molecule = Chem.MolFromSmiles(smiles)
descriptors.append(descriptor_calculator.CalcDescriptors(molecule))
print(descriptors)
Ici, j'ai expliqué comment utiliser RDKit avec Python. Si vous comprenez ce contenu, vous pourrez facilement calculer le descripteur du composé.
Recommended Posts