Ученые AIRI создали новую архитектуру нейронной сети DeepCT, которая может изучать сложные взаимосвязи между эпигенетическими свойствами клеток и интерпретировать варианты, найденные в геноме человека 🖇
Интерпретация некодирующих геномных вариантов является одной из важнейших задач генетики человека. Методы машинного обучения появились недавно как мощный инструмент для решения этой проблемы. Современные подходы позволяют прогнозировать транскрипционные и эпигенетические эффекты, вызванные некодирующими мутациями. Однако эти подходы требуют конкретных экспериментальных данных для обучения моделей и не могут быть распространены на типы клеток, где необходимые функции не были измерены экспериментально.
📢 Если говорить простыми словами, то гены кодируют белки. Это понятный код, в котором при смене одной буквы меняется и белок. Ученые могут предсказывать, что именно в белке поменялось.
Но кодирующие белки последовательности – это только 2% ДНК. С остальной частью все сложнее. Она регулирует не то, какой именно по составу будет белок, а какое количество белка образуется в клетке. Это тоже важно, но код, который используется в этой части генома, пока не расшифрован. Поэтому когда ученые видят, что у человека где-то между генами поменялась одна буква, то очень сложно сказать, насколько это важно и к чему приведет.
С помощью таких нейросетей, как DeepCT, исследователи пытаются предсказывать последствия мутаций в некодирующих областях.
📄 Ссылка на препринт статьи
📹 Разбор статьи в рубрике #AIRIPublished на YouTube от исследователя Вениамина Фишмана
Интерпретация некодирующих геномных вариантов является одной из важнейших задач генетики человека. Методы машинного обучения появились недавно как мощный инструмент для решения этой проблемы. Современные подходы позволяют прогнозировать транскрипционные и эпигенетические эффекты, вызванные некодирующими мутациями. Однако эти подходы требуют конкретных экспериментальных данных для обучения моделей и не могут быть распространены на типы клеток, где необходимые функции не были измерены экспериментально.
📢 Если говорить простыми словами, то гены кодируют белки. Это понятный код, в котором при смене одной буквы меняется и белок. Ученые могут предсказывать, что именно в белке поменялось.
Но кодирующие белки последовательности – это только 2% ДНК. С остальной частью все сложнее. Она регулирует не то, какой именно по составу будет белок, а какое количество белка образуется в клетке. Это тоже важно, но код, который используется в этой части генома, пока не расшифрован. Поэтому когда ученые видят, что у человека где-то между генами поменялась одна буква, то очень сложно сказать, насколько это важно и к чему приведет.
С помощью таких нейросетей, как DeepCT, исследователи пытаются предсказывать последствия мутаций в некодирующих областях.
📄 Ссылка на препринт статьи
📹 Разбор статьи в рубрике #AIRIPublished на YouTube от исследователя Вениамина Фишмана
YouTube
AIRI Published | Cell type-specific interpretation of noncoding variants using DL-based methods
Welcome to AIRI Published! In this section AIRI scientists talk about their research papers.
Title of the article: Cell type-specific interpretation of noncoding variants using deep learning-based methods
Link: https://www.biorxiv.org/content/10.1101/2…
Title of the article: Cell type-specific interpretation of noncoding variants using deep learning-based methods
Link: https://www.biorxiv.org/content/10.1101/2…
Статьи авторов группы «ИИ в Индустрии» AIRI вошли в топ-5 наиболее читаемых исследований в предметных областях журнала PeerJ Computer Science за 2022 год 👀
Рассказываем про статьи:
🔵 Первая статья посвящена задаче построения векторных представлений динамических графов. Такие представления полезны в задачах машинного обучения на графах и их приложениях, например, в рекомендательных системах или даже поиске мошенников на основе банковских транзакций.
В статье ученые дали классификацию методов построения векторных представлений, предложили новую модель, которая собрала лучшее из двух state-of-the-art моделей TGN и CAW, а также фреймворк, который позволяет корректно сравнивать разные модели на одинаковых наборах данных.
В исследовании принимали участие ученые из ВШЭ, МФТИ и Лаборатории ИИ Сбера.
🔵 Вторая статья посвящена различным способам интеграции рекуррентных блоков и механизмов внимания в задаче восстановления глубины без размеченных данных.
Ученые предложили ряд модификаций с использованием временной информации из предшествующих фреймов и новые нейросетевые архитектуры для оценки монокулярной глубины с помощью самообучения. Эксперименты с набором данных KITTI показали, что предлагаемые модификации могут быть эффективным инструментом для использования временной информации в предсказании глубины.
В исследовании принимали участие ученые из ВШЭ, ПОМИ РАН, Центра исследований больших данных НИТУ «МИСиС» и СПбГУ.
Читайте рубрику #AIRIPublished, в которой мы рассказываем про то, какие статьи выходят у наших ученых и советуем свежие публикации 🗞
Рассказываем про статьи:
В статье ученые дали классификацию методов построения векторных представлений, предложили новую модель, которая собрала лучшее из двух state-of-the-art моделей TGN и CAW, а также фреймворк, который позволяет корректно сравнивать разные модели на одинаковых наборах данных.
В исследовании принимали участие ученые из ВШЭ, МФТИ и Лаборатории ИИ Сбера.
Ученые предложили ряд модификаций с использованием временной информации из предшествующих фреймов и новые нейросетевые архитектуры для оценки монокулярной глубины с помощью самообучения. Эксперименты с набором данных KITTI показали, что предлагаемые модификации могут быть эффективным инструментом для использования временной информации в предсказании глубины.
В исследовании принимали участие ученые из ВШЭ, ПОМИ РАН, Центра исследований больших данных НИТУ «МИСиС» и СПбГУ.
Читайте рубрику #AIRIPublished, в которой мы рассказываем про то, какие статьи выходят у наших ученых и советуем свежие публикации 🗞
Please open Telegram to view this post
VIEW IN TELEGRAM