Genomics is een tak van genetica die grootschalige veranderingen in genomen van organismen bestudeert. Genomics en zijn subveld van transcriptomics, dat genoombrede veranderingen bestudeert in het RNA dat wordt getranscribeerd van DNA, bestudeert veel genen één keer. Genomics kan ook betrekking hebben op het lezen en uitlijnen van zeer lange sequenties van DNA of RNA. Het analyseren en interpreteren van dergelijke grootschalige, complexe gegevens vereist de hulp van computers. De menselijke geest, hoe fantastisch hij ook is, is niet in staat om zoveel informatie te verwerken. Bio-informatica is een hybride veld dat de kennis van de biologie en de kennis van de informatiewetenschap, een deelgebied van de informatica, samenbrengt.
Genomen bevatten veel informatie
Genomen van organismen zijn erg groot. Het menselijk genoom heeft naar schatting drie miljard basenparen die ongeveer 25.000 genen bevatten. Ter vergelijking: de fruitvlieg heeft naar schatting 165 miljard basenparen die 13.000 genen bevatten. Bovendien, een subveld van genomica genaamd transcriptomics studies welke genen, onder de tienduizenden in een organisme, worden op een bepaald moment, op meerdere tijdstippen en meerdere experimentele omstandigheden op elk moment in- of uitgeschakeld tijd punt. Met andere woorden, 'omics'-gegevens bevatten enorme hoeveelheden informatie die de menselijke geest niet kan bevatten zonder de hulp van computationele methoden in de bio-informatica.
Biologische gegevens
Bioinformatica is belangrijk voor genetisch onderzoek omdat genetische data een context heeft. De context is biologie. Levensvormen hebben bepaalde gedragsregels. Hetzelfde geldt voor weefsels en cellen, genen en eiwitten. Ze werken op bepaalde manieren met elkaar samen en reguleren elkaar op bepaalde manieren. De grootschalige, complexe gegevens die in genomics worden gegenereerd, zouden niet logisch zijn zonder de contextuele kennis van hoe levensvormen werken. De gegevens die door genomica worden gegenereerd, kunnen worden geanalyseerd met dezelfde methoden die worden gebruikt door ingenieurs en natuurkundigen die studeren financiële markten en glasvezel, maar het analyseren van de gegevens op een zinvolle manier vereist kennis van: biologie. Zo werd bio-informatica een hybride kennisgebied van onschatbare waarde.
Duizenden getallen kraken
Cijferkraken is een manier om te zeggen dat je aan het rekenen bent. Bioinformatica is in staat om in een paar minuten tienduizenden getallen te kraken, afhankelijk van hoe snel de computer informatie kan verwerken. Omics-onderzoek gebruikt computers om algoritmen -- wiskundige berekeningen -- op grote schaal uit te voeren om patronen in grote datasets te vinden. Veelgebruikte algoritmen omvatten functies zoals hiërarchische clustering (zie referentie 3) en hoofdcomponentenanalyse. Beide zijn technieken om relaties te vinden tussen steekproeven die veel factoren bevatten. Dit is vergelijkbaar met het bepalen of bepaalde etniciteiten vaker voorkomen tussen twee secties in een telefoonboek: achternamen die beginnen met een A versus achternaam die beginnen met een B.
Systeembiologie
Bioinformatica heeft het mogelijk gemaakt om te bestuderen hoe een systeem met duizenden bewegende delen zich gedraagt op het niveau van alle bewegende delen tegelijk. Het is als kijken naar een zwerm vogels die tegelijk vliegen of een school vissen die tegelijk zwemmen. Voorheen bestudeerden genetici slechts één gen tegelijk. Hoewel die benadering nog steeds ongelooflijk veel verdienste heeft en zal blijven doen, heeft bio-informatica het mogelijk gemaakt om nieuwe ontdekkingen te doen. Systeembiologie is een benadering om een biologisch systeem te bestuderen door meerdere bewegende delen te kwantificeren, zoals het bestuderen van de collectieve snelheid van verschillende groepen vogels die vliegen als één grote, zwenkende kudde.