Обзорная статья

ТЕХНОЛОГИИ ЗНАНИЙ В ПРОТЕОМИКЕ

^#Тел.: (499) 246-37-31; e-mail: [email protected]

*Научно-исследовательский институт биомедицинской химии им. Ореховича РАМН, 119121, Москва, ул. Погодинская, 10;
**Институт молекулярной биологии им. Энгельгардта РАН, Москва

Поступила в редакцию 16.08.2010 г. Принята к печати 06.09.2010 г.

Протеомные технологии позволяют идентифицировать тысячи белков в биологических образцах. Эти данные нуждаются в соответствующих средствах хранения, распространения и аналитической обработки для получения новых знаний. Автоматическая обработка результатов высокопроизводительных экспериментов осуществляется с использованием контролируемого словаря медицинских предметных рубрик (Medical Subjects Headings) и онтологии генов (GeneOntology). Поскольку онтологии и контролируемые словари постоянно меняются, возникает необходимость в инфраструктуре централизованного хранения протеомных данных и их последующей ревизии с учетом меняющихся представлений в предметной области. Масс-спектрометрические данные и результаты идентификации белков собраны в хранилищах PRIDE, The Global Proteome Machine, PeptideAtlas и других. С использованием такого рода хранилищ развиваются системы экстракции знаний, позволяющие проводить в автоматическом режиме сопоставление набора идентифицированных белков с генными онтологиями, медицинскими предметными рубриками, сведениями о метаболических и регуляторных путях. В обзоре рассматриваются современные информационно-аналитические ресурсы, обеспечивающие возможность использования технологий, основанных на знаниях в области протеомики.

Ключевые слова: база знаний; метаболические пути; генная онтология.