Кафедра биоинформатики и системной биологии

Кафедра проводит обучение студентов бакалавриата и магистратуры ФБМФ, теоретической системной биологии и биоинформатике, методам анализа экспериментальных генетических данных, в том числе общегеномных.

Кафедра была открыта в 2012 году для подготовки специалистов в области теоретической системной биологии и биоинформатики, критически важной дисциплины для развития постгеномной фармацевтики и медицины совеместно с Технологическим университетом Джорджии.

О кафедре

Учебные курсы в бакалавриате

Основы языка R

  • Введение в язык программирования R и IDE R-studio
  • Синтаксис R
  • Операторы и функции
  • Базовая графика в R
  • Реализация графиков с помощью пакета ggplot2
  • Корреляция и линейная регрессия
  • PCA и Heatmaps
  • Кластеризация в R
  • NGS и поиск дифференциально экспрессирующихся генов
  • Пакеты для работы с сиквенсами
Прикладная биоинформатика
  • Функциональные элементы генома
  • Основные ресурсы для анализа функциональных элементов генома
  • Геномные баузеры
  • Анализ структуры локуса генома человека
  • Экспрессионный анализ
  • Изучение регуляции локуса
  • Исследование кодирующего потенциала гена
  • Анализ функции белка
  • Сравнительно-геномный анализ локуса
  • Особенности анализа экспрессии генов
  • Анализ мутации в генах
  • Теория дизайна лабораторного эксперимента и представления данных
Клеточная биология
  • Введение в клеточную биологию
  • Введение в эмбриологию. Понятие стволовых клеток. Эпигенетика
  • Генетические и эпигенетические особенности репрограммированных соматических клеток
  • Применение технологии репрограммирования для изучения механизмов заболеваний и поиска новых методов терапии. Использование биоинформационных методов для разработки критериев репрограммирования
  • Репрограммирование клеток. Индуцированные плюрипотентные клетки
  • Эмбриональные стволовые клетки. Технология генетического нокаута
Машинное обучение в биологии
  • Классическая модель вероятностного пространства
  • Аксиоматическое построение теории вероятностей
  • Случайные величины и случайные векторы
  • Числовые характеристики распределений случайных величин
  • Производящие и характеристические функции случайных величин и векторов
  • Предельные теоремы
  • Основные понятия математической статистики
  • Точечное оценивание
  • Сравнение оценок
  • Эффективные оценки
  • Интервальное оценивание
  • Распределения, связанные с нормальным
  • Проверка гипотез
  • Критерии согласия
  • Исследование статистической зависимости
Введение в алгоритмы биоинформатики
  • Расстояние между последовательностями
  • Эффективный поиск множеств фрагментов ДНК в геноме
  • Секвенирование ДНК
  • Секвенирование и распознавание белков, поиск мотивов
  • Геномные перестройки, алгоритмы кластеризации
Глубокое обучение в биологии
  • Базовые архитектуры трансформеров: механизм Attention (key, query, value), виды attention, self‑attention и multi‑head attention.​
  • Архитектура Transformer и self‑supervised learning для текстов и биологических последовательностей (BERT, GPT, T5, ProtBERT, ESM).​
  • Трансформеры зрения (Visual Transformer) и self‑supervised learning на изображениях (SimCLR, DINO).​
  • Сегментация биологических и медицинских изображений (U‑Net, Segment Anything Models), задачи медицинской сегментации.​
  • Обнаружение объектов на изображениях (object detection) и применение архитектур семейства YOLOv8.​
  • Представление биологических данных в виде графов и методы разложения матриц, DeepWalk и Node2Vec.​
  • Графовые нейронные сети (GNN): GCN, GAT, гетерогенные графы, графы знаний, RGCN и RGAT.​
  • GNN для 3D‑структур биомолекул: AlphaFold 2, блок Evoformer, Invariant Point Attention, ProteinMPNN и оптимизация белков.​
  • Основы обучения с подкреплением (Reinforcement Learning): марковские процессы принятия решений, policy, value.​
  • Классические алгоритмы RL: Q‑learning, Deep Q‑Network, методы градиента политики (REINFORCE, PPO).​
  • Генеративный ИИ и большие языковые модели (LLM), методы семплирования и Retrieval‑Augmented Generation (RAG).​
  • Генерация биологических последовательностей с помощью генеративных моделей.​
  • Диффузионные модели (Diffusion, schedules) и их использование в задачах RFDiffusion.​
  • Пайплайны генерации белков с заданными свойствами с использованием современных генеративных моделей.

Учебные курсы в магистратуре

Проблемы биоинформатики/ОМИКСы

• Языки программирования Perl и MySQL, а также основы работы в операционной системе UNIX;
• Основные биоинформатические базы данных;
• Базовые алгоритмы и форматы данных биоинформатики
Дополнительные главы биостатистики
• Структура биологических данных и описательные статистики. Организация файлов и управление данными в программах EXCEL, SPSS и STATISTICA. Параметрические и непараметрические критерии сравнения. Дисперсионный анализ.
• Анализ сопряженности признаков
• Статистика биомаркеров. Оценки чувствительности и специфичности теста.
• Многомерные методы статистического анализа.
• Байесовская статистика
Дополнительные главы биоинформатики
• Применение BLAST
• Алгоритмы динамического программирования
• Быстрый поиск подстроки в строке
• Индекс и преобразование Барроуза-Уиллера
• Методы функциональной аннотации генома
• Мотивы в геномах
• Основные структуры данных: хэш-таблица, суффиксное дерево, суффиксный массив
• Оценка параметров скрытой цепи Маркова, роль динамического программирования и байесовского оценивания.
• Приложения алгоритмов динамического программирования
Введение в метагеномику
• Микробиота (микробиом) человека. Функции в норме и при патологии
• Пробиотики — применение, механизмы действия, перспективы использования
• Постгеномные технологии (-омики), используемые при изучении микробиоты (микробиома) человека
• Функциональные биомаркеры (гены) для диагностики и метагеномного анализа
• Биомишени и механизмы действия систем токсин-антитоксин II типа
• Сравнительная геномика бактерий микробиоты кишечника человека
Геногеография
• Теоретические основы динамики генофондов и их практическое проявление на примерах реальных генофондов;
• Методы анализа структуры генофонда;
• Основные закономерности в структуре мирового генофонда;
• Достижения и перспективы исследования древней ДНК;
• Взаимосвязь генетической, лингвистической и антропологической изменчивости
Вычислительные методы в системной биологии
• Базы данных GEO и ArrayExpress, содержащие информацию о геноме человека;
• Инструменты для анализа и визуализации сетей и графов: пакеты программ Gephi, NetworkX;
• Программы для представления и расчета данных в Матлаб, Python;
• Различные форматы данных;
• Методы получения и обработки данных с ДНК-микрочипов
Анализ данных высокопроизводительного секвенирования
• Технологии высокопроизводительного секвенирования
• Основы работы с командной строкой Linux
• Предобработка результатов секвенирования
• Cборка геномов и транскриптомов de novo
• Аннотация геномных последовательностей
• Ресеквенирование
• RNA-seq, метагеномика
• ChIP-seq. Взаимодействие ДНК и белка

Преподаватели курсов

На кафедре ведется набор на два направления магистратуры:

Биофизика и биоинформатика

Диплом по специальности
03.04.01 Прикладные математика и физика
Поступить на программы

Биотехнология

Диплом по специальности
19.04.01 Биотехнология
Специализация
Молекулярные биология и биофизика
Специализация

Смотреть видео об институте

Контакты
Представители кафедры
Заведующий кафедрой
Макеев Всеволод Юрьевич,
д. ф.-м. н.
Мухамбетова Амина Нурумовна

+7 (498) 713-92-10
mukhambetova.an@phystech.edu
Куратор программы от ФБМФ

ИОГен РАН
119991, г. Москва,
ул. Губкина, 3