Skip to content

Последний проект по майнору "Биоинформатика" в Высшей Школе Экономики

Notifications You must be signed in to change notification settings

isaf27/hse21_H3K9me3_ZDNA_human

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

hse21_H3K9me3_ZDNA_human

Организм: human.

Гистоновая метка: H3K9me3.

Тип клеток: A549.

ChIP-seq эксперименты:

1. Анализ пиков гистоновой метки.

Построим гистограммы распределения длин участков для каждого из экспериментов (ENCFF444EWQ, ENCFF811QUJ) до и после конвертации из версии генома hg38 в hg19.

1.1. Эксперимент ENCFF444EWQ

  • версия генома hg38 alt text

  • после конвертации в версию генома hg19 alt text

1.2. Эксперимент ENCFF811QUJ

  • версия генома hg38 alt text

  • после конвертации в версию генома hg19 alt text

1.3. Вывод

Гистограммы длин пиков не поменялись, никаких аномалий не произошло, поэтому можно переходить к следующим шагам.

Команды:

liftOver H3K9me3_A549.ENCFF444EWQ.hg38.bed hg38ToHg19.over.chain.gz H3K9me3_A549.ENCFF444EWQ.hg19.bed H3K9me3_A549.ENCFF444EWQ.unmapped.bed
liftOver H3K9me3_A549.ENCFF811QUJ.hg38.bed hg38ToHg19.over.chain.gz H3K9me3_A549.ENCFF811QUJ.hg19.bed H3K9me3_A549.ENCFF811QUJ.unmapped.bed

2. Удаление длинных участков

Для каждого из экспериментов удалим пики, которые имеют длину (> 5000). Снова нарисуем гистограммы распределения длин участков.

2.1. Эксперимент ENCFF444EWQ

alt text

2.2. Эксперимент ENCFF811QUJ

alt text

3. Анализ расположения участков

Посмотрим, где располагаются пики гистоновой метки относительно аннотированных генов. Для этого построим pie-chart с помощью R-библиотеки ChIPseeker.

3.1. Эксперимент ENCFF444EWQ

alt text

3.2. Эксперимент ENCFF811QUJ

alt text

4. Анализ участков вторичной структуры ДНК

4.1. Гистограмма распределения длин участков

alt text

4.2. Расположение относительно аннотированных генов

alt text

5. Анализ пересечения гистоновой метки и вторичной структуры ДНК.

Построим объединение участков из экспериментов ENCFF444EWQ и ENCFF811QUJ. После этого построим пересечение с вторичной структурой ДНК.

5.1. Распределение длин участков для построенного пересечения

alt text

5.2. Расположение относительно аннотированных генов для построенного пересечения

alt text

Команды:

cat *.filtered.bed | sort -k1,1 -k2,2n | bedtools merge > H3K9me3_A549.merge.hg19.bed
bedtools intersect -a DeepZ.bed -b H3K9me3_A549.merge.hg19.bed > H3K9me3_A549.intersect_with_DeepZ.bed

6. Визуализация в геномном браузере

Визуализируем в геномном браузере:

  • эксперимент ENCFF444EWQ (название ENCFF444EWQ)
  • эксперимент ENCFF811QUJ (название ENCFF811QUJ)
  • вторичная структура ДНК (название DeepZ)
  • объединение экспериментов (название ChIP_merge)
  • пересечение со вторичной структурой ДНК (название intersect_with_DeepZ)

Ссылка на сессию в UCSC GenomeBrowser: https://genome.ucsc.edu/s/isaf27/hse21_H3K9me3_ZDNA_human

Приведем два примера различных пересечений:

  • Пересечение двух экспериментов, а также вторичной структуры ДНК. Его можно увидеть на гене ZNF585A, координаты chr19:37,657,445-37,672,018.

alt text

  • Пересечение объединения двух экспериментов и вторичной структуры ДНК. Его можно увидеть в межгенном пространстве, координаты chr1:2,787,757-2,788,245.

alt text

7. Ассоциация с генами

С помощью R-библиотеки ChIPpeakAnno сделаем ассоциацию полученных пиков (в пересечении с вторичной структурой ДНК) с ближайшими генами.

Всего удалось проассоциировать 133 пика, получилось 92 уникальных гена.

Проведем GO-анализ для полученных уникальных генов при помощи сайта http://pantherdb.org/. Получаем следующий список категорий:

alt text

About

Последний проект по майнору "Биоинформатика" в Высшей Школе Экономики

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages