Genomika je odvětví genetiky, které studuje rozsáhlé změny v genomech organismů. Genomika a její podpole transkriptomik, která studuje genomové změny v RNA, která je transkribována z DNA, studuje mnoho genů najednou. Genomika může také zahrnovat čtení a srovnávání velmi dlouhých sekvencí DNA nebo RNA. Analýza a interpretace tak rozsáhlých a složitých dat vyžaduje pomoc počítačů. Lidská mysl, jakkoli vynikající, není schopna zvládnout tolik informací. Bioinformatika je hybridní pole, které spojuje znalosti biologie a znalosti informační vědy, což je podoblast počítačové vědy.
Genomy obsahují spoustu informací
Geny organismů jsou velmi velké. Odhaduje se, že lidský genom má tři miliardy párů bází, které obsahují asi 25 000 genů. Pro srovnání se odhaduje, že ovocná muška má 165 miliard párů bází, které obsahují 13 000 genů. Navíc podpole genomiky zvané transkriptomické studie, které geny, mezi desítkami tisíc v organismus, jsou zapnuty nebo vypnuty v daném čase, ve více časových bodech a v různých experimentálních podmínkách časový bod. Jinými slovy, „omická“ data obsahují obrovské množství informací, které lidská mysl nedokáže pochopit bez pomoci výpočetních metod v bioinformatice.
Biologická data
Bioinformatika je pro genetický výzkum důležitá, protože genetické údaje mají svůj kontext. Kontext je biologie. Formy života mají určitá pravidla chování. Totéž platí pro tkáně a buňky, geny a proteiny. Interagují určitými způsoby a určitými způsoby se navzájem regulují. Rozsáhlá a komplexní data generovaná v genomice by neměla smysl bez kontextové znalosti toho, jak fungují formy života. Data generovaná genomikou mohou být analyzována stejnými metodami, jaké používají inženýři a fyzici, kteří studují finanční trhy a optická vlákna, ale analýza dat způsobem, který dává smysl, vyžaduje znalost biologie. Bioinformatika se tak stala neocenitelným hybridním polem znalostí.
Křupavé tisíce čísel
Číselné shrnutí je způsob, jak říci, že člověk provádí výpočty. Bioinformatika je schopná prolomit desítky tisíc čísel za pár minut, v závislosti na tom, jak rychle dokáže počítač zpracovat informace. Výzkum společnosti Omics používá počítače ke spouštění algoritmů - matematických výpočtů - ve velkém měřítku, aby našel vzory ve velkých souborech dat. Mezi běžné algoritmy patří funkce jako hierarchické shlukování (viz odkaz 3) a analýza hlavních komponent. Obě jsou techniky k nalezení vztahů mezi vzorky, které v sobě mají mnoho faktorů. Je to podobné jako s určením, zda jsou určitá etnika běžnější mezi dvěma částmi telefonního seznamu: příjmení začínající písmenem A versus příjmení začínající písmenem B.
Systémová biologie
Bioinformatika umožnila studovat, jak se systém, který má tisíce pohyblivých částí, chová na úrovni všech pohybujících se částí najednou. Je to jako sledovat hejno ptáků létajících unisono nebo hejno ryb unisono plavat. Dříve genetici studovali pouze jeden gen najednou. Ačkoli tento přístup má stále neuvěřitelné množství zásluh a bude v něm pokračovat, bioinformatika umožnila nové objevy. Systémová biologie je přístup ke studiu biologického systému kvantifikací více pohyblivých částí, jako studium kolektivní rychlosti různých kapes ptáků, kteří létají jako jeden velký, vybočení stádo.