Геноміка - це розділ генетики, який вивчає масштабні зміни геномів організмів. Геноміка та її підполе транскриптоміки, що вивчає загальногеномні зміни РНК, яка транскрибується з ДНК, вивчає багато генів. Геноміка може також передбачати зчитування та вирівнювання дуже довгих послідовностей ДНК або РНК. Для аналізу та інтерпретації таких масштабних, складних даних потрібна допомога комп’ютерів. Людський розум, який би не був чудовим, не здатний обробляти таку кількість інформації. Біоінформатика - це гібридна галузь, яка об’єднує знання біології та знання інформатики, яка є підгалузю інформатики.
Геноми містять багато інформації
Геноми організмів дуже великі. За оцінками, геном людини має три мільярди пар основ, які містять близько 25 000 генів. Для порівняння, за оцінками, плодова муха має 165 мільярдів пар основ, які містять 13 000 генів. Крім того, підполе геноміки, зване транскриптомікою, вивчає гени, серед десятків тисяч в організм, вмикаються або вимикаються в певний час, через кілька часових точок і безліч експериментальних умов у кожному момент часу. Іншими словами, дані «оміки» містять величезну кількість інформації, яку людський розум не може зрозуміти без допомоги обчислювальних методів у біоінформатиці.
Біологічні дані
Біоінформатика важлива для генетичних досліджень, оскільки генетичні дані мають контекст. Контекст - біологія. Форми життя мають певні правила поведінки. Те саме стосується тканин і клітин, генів і білків. Вони взаємодіють певним чином і певним чином регулюють один одного. Масштабні, складні дані, що генеруються в геноміці, не мали б сенсу без контекстуального знання того, як працюють форми життя. Дані, отримані геномікою, можуть бути проаналізовані тими ж методами, що використовуються інженерами та фізиками, які вивчають фінансових ринків та волоконної оптики, але аналіз даних таким чином, що має сенс, вимагає знань біологія. Таким чином, біоінформатика стала неоціненною гібридною галуззю знань.
Хрустять тисячі чисел
Подрібнення чисел - це спосіб сказати, що ви робите обчислення. Біоінформатика здатна збити десятки тисяч чисел за кілька хвилин, залежно від того, наскільки швидко комп’ютер може обробити інформацію. Дослідження Omics використовує комп’ютери для запуску алгоритмів - математичних розрахунків - у великих масштабах, щоб знайти закономірності у великих наборах даних. Загальні алгоритми включають такі функції, як ієрархічна кластеризація (див. Посилання 3) та аналіз основних компонентів. І ті, і інші є методами пошуку зв’язків між зразками, які мають багато факторів. Це схоже на визначення, чи певні етнічні групи частіше зустрічаються між двома розділами телефонної книги: прізвища, які починаються на А, проти прізвищ, які починаються на Б
Системна біологія
Біоінформатика дозволила вивчити, як поводиться система, що має тисячі рухомих частин, на рівні всіх частин, що рухаються одночасно. Це все одно, що спостерігати, як зграя птахів дружно літає, або зграя риб плаває в унісон. Раніше генетики одночасно вивчали лише один ген. Хоча цей підхід все ще має неймовірно багато переваг і буде продовжувати робити це, біоінформатика дозволила робити нові відкриття. Системна біологія - це підхід до вивчення біологічної системи шляхом кількісного визначення кількох рухомих частин, подібно вивченню колективної швидкості різних кишень птахів, які літають як одна велика, звиваюча зграя.