La genomica è una branca della genetica che studia i cambiamenti su larga scala nei genomi degli organismi. La genomica e il suo sottocampo della trascrittomica, che studia i cambiamenti dell'intero genoma nell'RNA che viene trascritto dal DNA, studia che molti geni sono una volta. La genomica può anche comportare la lettura e l'allineamento di sequenze molto lunghe di DNA o RNA. L'analisi e l'interpretazione di dati così complessi e su larga scala richiedono l'aiuto dei computer. La mente umana, per quanto superba, è incapace di gestire così tante informazioni. La bioinformatica è un campo ibrido che riunisce la conoscenza della biologia e la conoscenza della scienza dell'informazione, che è un sottocampo dell'informatica.
I genomi contengono molte informazioni
I genomi degli organismi sono molto grandi. Si stima che il genoma umano contenga tre miliardi di coppie di basi che contengono circa 25.000 geni. Per fare un confronto, si stima che il moscerino della frutta abbia 165 miliardi di paia di basi che contengono 13.000 geni. Inoltre, un sottocampo della genomica chiamato trascrittomica studia quali geni, tra le decine di migliaia in un organismo, si accendono o si spengono in un dato momento, in più punti temporali e in più condizioni sperimentali in ciascuno di essi punto temporale. In altre parole, i dati "omici" contengono grandi quantità di informazioni che la mente umana non può afferrare senza l'aiuto di metodi computazionali in bioinformatica.
Dati biologici
La bioinformatica è importante per la ricerca genetica perché i dati genetici hanno un contesto. Il contesto è la biologia. Le forme di vita hanno determinate regole di comportamento. Lo stesso vale per tessuti e cellule, geni e proteine. Interagiscono in determinati modi e si regolano a vicenda in determinati modi. I dati complessi e su larga scala che vengono generati nella genomica non avrebbero senso senza la conoscenza contestuale di come funzionano le forme di vita. I dati generati dalla genomica potrebbero essere analizzati con gli stessi metodi utilizzati da ingegneri e fisici che studiano mercati finanziari e della fibra ottica, ma analizzare i dati in modo sensato richiede la conoscenza di biologia. Così, la bioinformatica è diventata un prezioso campo ibrido di conoscenza.
Sgranocchiare migliaia di numeri
Il calcolo dei numeri è un modo per dire che si stanno facendo calcoli. La bioinformatica è in grado di elaborare decine di migliaia di numeri in pochi minuti, a seconda della velocità con cui il computer può elaborare le informazioni. La ricerca Omics utilizza i computer per eseguire algoritmi - calcoli matematici - su larga scala per trovare modelli in grandi set di dati. Gli algoritmi comuni includono funzioni come il clustering gerarchico (vedi riferimento 3) e l'analisi dei componenti principali. Entrambe sono tecniche per trovare relazioni tra campioni che contengono molti fattori. Questo è simile a determinare se determinate etnie sono più comuni tra due sezioni di un elenco telefonico: cognomi che iniziano con A rispetto a cognomi che iniziano con B.
Biologia dei sistemi
La bioinformatica ha permesso di studiare come si comporta un sistema che ha migliaia di parti in movimento a livello di tutte le parti in movimento contemporaneamente. È come guardare uno stormo di uccelli volare all'unisono o un banco di pesci nuotare all'unisono. In precedenza, i genetisti studiavano solo un gene alla volta. Sebbene questo approccio abbia ancora un'incredibile quantità di meriti e continuerà a farlo, la bioinformatica ha permesso di fare nuove scoperte. La biologia dei sistemi è un approccio allo studio di un sistema biologico quantificando più parti mobili, come studiare la velocità collettiva di diverse sacche di uccelli che volano come un unico grande, deviando gregge.