ITaS

Information Technology and Systems - 2011
Conference for Young Scientists and Engineers
October 2 – 7, 2011

Ðóññêèé | English


 

 

Visitors:









 

Monday, October 3
16:50 - 18:50
Ballroom A
Session: Bioinformatics: Eukaryotes and Algorithms (rus)
Chair: Ph.D. Irena Artamonova

Yuri Fantin, Alexey Neverov, Alexander Favorov, Andrey Mironov, Vladimir Chulanov
The tool for analysis of direct sequencing chromatograms Downoad paper
Abstract: Метод прямого или популяционного секвенирования продукта ПЦР широко применяется в медицинских диагностических и научных целях. Хроматограммы полученные данным методом содержат информацию о смеси типов ДНК, одновременно амплифицированных при ПЦР. Важной задачей является извлечение информации, характеризующей генетическое разнообразие этих вариантов без применения клонирования ПЦР продукта. В настоящей работе мы предлагаем новый метод расшифровки хроматограммы популяционного секвенирования и новый жадный алгоритм расшифровки структуры популяции - BCV. На входе алгоритма — последовательность пиков хроматограммы и словарь (множественное выравнивание последовательностей). Мы предполагаем, что хроматограмма является результатом секвенирования локуса генома, гомологичного последовательностям словаря. Существует три основных варианта использования программы: - Определение нуклеотидной последовательности хроматограммы, - Определение типов ДНК, составляющих секвенируемую популяцию. Предсказанные ДНК-типы далее могут быть охарактеризованы методами поиска по базам данных биологических последовательностей (например, blast) или с помощью филогенетического анализа совместно с последовательностями словаря. - Определение наличия и размера делеций/вставок и их положений относительно референс последовательности. Построение консенсус-последовательности, соответствующей доминирующей в смеси субпопуляции типов ДНК. Мы показали применимость метода для разделения смеси генотипов вируса гепатита В, типирования бактериальных сообществ в клинических образцах человека по 16S РНК и определения делеций/вставок в гене PncA M. tuberculosis.

Anna Nikulova, Andrey Mironov, Alexander Favorov
CORECLUST: prediction of cis-regulatory modules together with deciphering of their conserved regulatory grammar Downoad paper
Abstract: Для понимания регуляции транскрипции генов необходимо знать закономерности, лежащие в основе группировки сайтов связывания факторов транскрипции (ССТФ) и формирования ткане-специфичных регуляторных элементов. В этой работе мы представляем метод - CORECLUST (COnservative REgulatory CLUster Structure) - для поиска регуляторных участков в геномах эукариот. Используя набор известных позиционно-весовых матриц, CORECLUST конструирует модель регуляторного участка данного гена, описывающую консервативные правила взаиморасположения ССТФ (структуру регуляторного участка). Построенная модель далее может быть использована для поиска регуляторных участков со схожей структурой, а также для изучения регуляторной «грамматики» исследуемой системы. Применение CORECLUST к хорошо изученной системе Drosophila показало, что, имея в качестве исходных данных только один ортологичный кластер генов, наш алгоритм находит значительное количество сходно регулирующихся генов. Изучение структуры регуляторных участков генов раннего развития Drosophila выявило закономерности в расположении ССТФ, характерные для этой системы, некоторые из которых подтверждаются литературными данными. По сравнению с двумя другими известными программами, CORECLUST демонстрирует лучшую корреляцию предсказанных регуляторных модулей с известными регуляторными участками.

Pavel Mazin, Philipp Khaitovich, Mikhail Gelfand
Splicing changes in primate brain development Downoad paper
Abstract: Несмотря на интенсивные исследования, молекулярные механизмы, ответственные за анатомические, поведенческие и когнитивные отличия человека от его ближайших эволюционных родственников - обезьян, остаются неясными. В данной работе мы использовали методы секвенирования нового поколения, чтобы исследовать разницу в сплайсинге между человеком, шимпанзе и макакой в двух областях головного мозга - префронтальной коре и мозжечке, в новорожденных и взрослых. Мы показали, что из более чем 10 тысяч генов, экспрессирующихся на детектируемом уровне, более 12% имеют значимые различия в сплайсинге белок-кодирующих экзонов между видами. Таким образом, сплайсинг может играть существенную роль в фенотипических отличиях между приматами.

Ekaterina Khrameeva, Mikhail Gelfand
Interlaboratory and Interplatform Comparisons of 117 mRNA and Genome Sequencing Experiments Downoad paper
Abstract: Next-generation sequencing technologies have completely transformed the field of genetics, making it possible to generate large amounts of sequence data very rapidly and at a low cost. However, it is not clear to what extent the obtained results are consistent across platforms or versions thereof, or even between different laboratories. We observed high dependency of the gene coverage profiles on the producing laboratory. Sequencing of transcriptomes in different laboratories, even from the same tissue and on identical platforms, yielded quite different gene coverage profiles.

Alexander Panchin, Irena Artamonova
Splice site evolution in families of recently duplicated human genes Downoad paper
Abstract: Используя метод максимального правдоподобия, мы реконструировали историю эволюции сайтов сплайсинга на выборке семейств паралогичных генов человека с двумя и более экзонами. Оказалось, что при дупликации генов сайты сплайсинга чаще появляются, чем исчезают. Реконструированные предки вновь приобретенных сайтов сплайсинга, как правило, имеют относительно низкое значения силы сайта, в то время как сила пропавших сайтов, потерявших функциональность, в среднем, имеет довольно высокое значение. При этом рождение сайтов сплайсинга ассоциировано с существенным увеличением силы сайта, а исчезновение - с уменьшением.