Химия - Поиск количественных соотношений структура-свойство - Моделирование свойств при векторном описании химических соединений
01 марта 2011Оглавление:
1. Поиск количественных соотношений структура-свойство
2. Моделирование свойств при векторном описании химических соединений
3. Моделирование свойств при невекторном описании химических соединений
При векторном описании химической структуре ставится в соответствие вектор молекулярных дескрипторов, каждый из которых представляет собой инвариант молекулярного графа.
Молекулярные дескрипторы
Существующие наборы молекулярных дескрипторов могут быть условно разделены на следующие категории:
- Фрагментные дескрипторы существуют в двух основных вариантах бинарном и целочисленном. Бинарные фрагментные дескрипторы показывают, содержится ли данный фрагмент в структурной формуле, тогда как целочисленные фрагментные дескрипторы показывают, сколько раз данный фрагмент содержится в структурной формуле. В обзоре описано 11 основных категорий фрагментных дескрипторов. Уникальная роль фрагментных дескрипторов заключается в том, что, как показано в работах, они образуют базис дескрипторного пространства, то есть любой молекулярный дескриптор, являющийся инвариантом молекулярного графа, может быть однозначно разложен по этому базису. Кроме моделирования свойств органических соединений, бинарные фрагментные дескрипторы в форме молекулярных ключей и молекулярных отпечатков пальцев применяются при работе с базами данных для ускорения подструктурного поиска и организации поиска по подобию.
- Топологические индексы.
- Физико-химические дескрипторы это числовые характеристики, получаемые в результате моделирования физико-химических свойств химеческих соединений, либо величины, имеющие четкую физико-химическую интерпретацию. Наиболее часто используются в качестве дескрипторов: липофильность, молярная рефракция, молекулярный вес, дескрипторы водородной связи, молекулярные объемы и площади поверхностей.
- Квантово-химические дескрипторы это числовые величины, получаемые в результате квантово-химических расчетов. Наиболее часто в качестве дескрипторов используются: энергии граничных молекулярных орбиталей, частичные заряды на атомах и частичные порядки связей, индексы реакционной способности Фукуи, энергии катионной, анионной и радикальной локализации, дипольный и высшие мультипольные моменты распределения электростатического потенциала.
- Дескрипторы молекулярных полей это числовые величины, аппроксимирующие значения молекулярных полей путем вычисления энергии взаимодействия пробного атома, помещенного в узел решетки, с текущей молекулой. На построении корреляций между значениями дескрипторов молекулярных полей и числовым значением биологической активности при помощи метода частичных наименьших квадратов основаны методы 3D-QSAR, наиболее известным из которых является CoMFA.
- Константы заместителей впервые были введены Л. П. Гамметом в рамках уравнения, получившего его имя, которое связывает константы скорости реакции с константами равновесия для некоторых классов органических реакций. Константы заместителей вошли в практику QSAR после появления уравнения Ганча-Фуджиты, связывающего биологическую активность с константами заместителей и значением липофильности. В настоящее время известно несколько десятков констант заместителей.
- Фармакофорные дескрипторы показывают, могут ли простейшие фармакофоры, состоящие из пар или троек фармакофорных центров со специфицированным расстоянием между ними, содержатся внутри анализируемой молекулы.
Молекулярные дескрипторы наиболее полно описаны в монографии, которую можно считать энциклопедией молекулярных дескрипторов.
Методы построения моделей
Для решения регрессионной задачи при векторном описании структур химических соединений чаще всего в хемоинформатике применяются следующие методы математической статистики и машинного обучения:
- Множественная линейная регрессия
- Метод частичных наименьших квадратов
- Искусственные нейронные сети
- Регрессия на опорных векторах
- Метод k ближайших соседей
Для решения классификационной задачи при векторном описании структур химических соединений чаще всего в хемоинформатике применяются следующие методы математической статистики и машинного обучения:
- Байесовские методы
- Линейный дискриминантный анализ
- Искусственные нейронные сети
- Метод опорных векторов
- Деревья принятий решений
- Метод k ближайших соседей
Просмотров: 3730
|