Це курс практичних занять підготовлений для Школи біоінформатики BDS^3 (Ukrainian Biological Data Science School) в Ужгороді у 2024 році. Метою серіі ноутбуків є обробка данних метагеному та виявлення ассоціаціі присутніх бактерій з захворюванням. Код написан для версії Python 3.8.3. Використання інших версій Python може потребувати оптимізаціі коду.
Посилання на школу: https://www.bds3.org/
Курс має модульну структуру. Кожен ноутбук може бути викрористаний окремо.
- step1_metadata.ipynb Аналіз метаданих людей, зразки яких доступні до аналізу. Структура популяції. histogram, piechart, swarmplot, violinplot.
- step2_metagenome_profiling.ipynb Приклади результатів найпоширеніших програм для профілювання метагеному. Аналіз продуктивності програм за допомогою штучних даних. Вивчення barplot, swarmplot, scatterplot.
- step3_mags_qual.ipynb Поняття MAG - Metagenome-Assembled Genomes чи геном, зібраний з метагеномних даних. Показники якості MAG. Чим відрізняється аналіз метагеному за допомогою профайлінгу та збірки геномів з метагеномних даних de novo?
- step4_taxa.ipynb Аналіз та візуалізауія таксономії присутніх бактерій. Обговорення концепціі GTDB та різниці між ncbi та gtdb таксономією (додатковий скрипт - пошук аналогів назв видів між цими двома системами).
- step5_MWAS.ipynb Пошук ассоціацій між бактеріями та хворобами (та іншими характеристиками).
- step6_corr_plot.ipynb Візуалізація ассоціацій (MWAS analysis, heatplot)