Обзорная статья
ТЕХНОЛОГИИ ЗНАНИЙ В ПРОТЕОМИКЕ
© 2011 г. Е. А. Пономаренко*#, Е. В. Ильгисонис**, А. В. Лисица*
#Тел.: (499) 246-37-31; e-mail: [email protected]
*Научно-исследовательский институт биомедицинской химии им. Ореховича РАМН, 119121, Москва, ул. Погодинская, 10; **Институт молекулярной биологии им. Энгельгардта РАН, Москва
Поступила в редакцию 16.08.2010 г. Принята к печати 06.09.2010 г.
Протеомные технологии позволяют идентифицировать тысячи белков в биологических образцах. Эти данные нуждаются в соответствующих средствах хранения, распространения и аналитической обработки для получения новых знаний. Автоматическая обработка результатов высокопроизводительных экспериментов осуществляется с использованием контролируемого словаря медицинских предметных рубрик (Medical Subjects Headings) и онтологии генов (GeneOntology). Поскольку онтологии и контролируемые словари постоянно меняются, возникает необходимость в инфраструктуре централизованного хранения протеомных данных и их последующей ревизии с учетом меняющихся представлений в предметной области. Масс-спектрометрические данные и результаты идентификации белков собраны в хранилищах PRIDE, The Global Proteome Machine, PeptideAtlas и других. С использованием такого рода хранилищ развиваются системы экстракции знаний, позволяющие проводить в автоматическом режиме сопоставление набора идентифицированных белков с генными онтологиями, медицинскими предметными рубриками, сведениями о метаболических и регуляторных путях. В обзоре рассматриваются современные информационно-аналитические ресурсы, обеспечивающие возможность использования технологий, основанных на знаниях в области протеомики.
Ключевые слова: база знаний; метаболические пути; генная онтология.