Химия - Поиск количественных соотношений структура-свойство - Моделирование свойств при векторном описании химических соединений

01 марта 2011


Оглавление:
1. Поиск количественных соотношений структура-свойство
2. Моделирование свойств при векторном описании химических соединений
3. Моделирование свойств при невекторном описании химических соединений



При векторном описании химической структуре ставится в соответствие вектор молекулярных дескрипторов, каждый из которых представляет собой инвариант молекулярного графа.

Молекулярные дескрипторы

Существующие наборы молекулярных дескрипторов могут быть условно разделены на следующие категории:

  1. Фрагментные дескрипторы существуют в двух основных вариантах — бинарном и целочисленном. Бинарные фрагментные дескрипторы показывают, содержится ли данный фрагмент в структурной формуле, тогда как целочисленные фрагментные дескрипторы показывают, сколько раз данный фрагмент содержится в структурной формуле. В обзоре описано 11 основных категорий фрагментных дескрипторов. Уникальная роль фрагментных дескрипторов заключается в том, что, как показано в работах, они образуют базис дескрипторного пространства, то есть любой молекулярный дескриптор, являющийся инвариантом молекулярного графа, может быть однозначно разложен по этому базису. Кроме моделирования свойств органических соединений, бинарные фрагментные дескрипторы в форме молекулярных ключей и молекулярных отпечатков пальцев применяются при работе с базами данных для ускорения подструктурного поиска и организации поиска по подобию.
  2. Топологические индексы.
  3. Физико-химические дескрипторы — это числовые характеристики, получаемые в результате моделирования физико-химических свойств химеческих соединений, либо величины, имеющие четкую физико-химическую интерпретацию. Наиболее часто используются в качестве дескрипторов: липофильность, молярная рефракция, молекулярный вес, дескрипторы водородной связи, молекулярные объемы и площади поверхностей.
  4. Квантово-химические дескрипторы — это числовые величины, получаемые в результате квантово-химических расчетов. Наиболее часто в качестве дескрипторов используются: энергии граничных молекулярных орбиталей, частичные заряды на атомах и частичные порядки связей, индексы реакционной способности Фукуи, энергии катионной, анионной и радикальной локализации, дипольный и высшие мультипольные моменты распределения электростатического потенциала.
  5. Дескрипторы молекулярных полей — это числовые величины, аппроксимирующие значения молекулярных полей путем вычисления энергии взаимодействия пробного атома, помещенного в узел решетки, с текущей молекулой. На построении корреляций между значениями дескрипторов молекулярных полей и числовым значением биологической активности при помощи метода частичных наименьших квадратов основаны методы 3D-QSAR, наиболее известным из которых является CoMFA.
  6. Константы заместителей впервые были введены Л. П. Гамметом в рамках уравнения, получившего его имя, которое связывает константы скорости реакции с константами равновесия для некоторых классов органических реакций. Константы заместителей вошли в практику QSAR после появления уравнения Ганча-Фуджиты, связывающего биологическую активность с константами заместителей и значением липофильности. В настоящее время известно несколько десятков констант заместителей.
  7. Фармакофорные дескрипторы показывают, могут ли простейшие фармакофоры, состоящие из пар или троек фармакофорных центров со специфицированным расстоянием между ними, содержатся внутри анализируемой молекулы.

Молекулярные дескрипторы наиболее полно описаны в монографии, которую можно считать энциклопедией молекулярных дескрипторов.

Методы построения моделей

Для решения регрессионной задачи при векторном описании структур химических соединений чаще всего в хемоинформатике применяются следующие методы математической статистики и машинного обучения:

  1. Множественная линейная регрессия
  2. Метод частичных наименьших квадратов
  3. Искусственные нейронные сети
  4. Регрессия на опорных векторах
  5. Метод k ближайших соседей

Для решения классификационной задачи при векторном описании структур химических соединений чаще всего в хемоинформатике применяются следующие методы математической статистики и машинного обучения:

  1. Байесовские методы
  2. Линейный дискриминантный анализ
  3. Искусственные нейронные сети
  4. Метод опорных векторов
  5. Деревья принятий решений
  6. Метод k ближайших соседей


Просмотров: 3730


<<< Молекулярный граф
Теорема Редфилда Пойа >>>