जीनोमिक्स आनुवंशिकी की एक शाखा है जो जीवों के जीनोम में बड़े पैमाने पर होने वाले परिवर्तनों का अध्ययन करती है। जीनोमिक्स और ट्रांसक्रिपटॉमिक्स के इसके उपक्षेत्र, जो डीएनए से लिखित आरएनए में जीनोम-व्यापी परिवर्तनों का अध्ययन करते हैं, कई जीन एक बार अध्ययन करते हैं। जीनोमिक्स में डीएनए या आरएनए के बहुत लंबे अनुक्रमों को पढ़ना और संरेखित करना भी शामिल हो सकता है। इतने बड़े पैमाने पर जटिल डेटा का विश्लेषण और व्याख्या करने के लिए कंप्यूटर की मदद की आवश्यकता होती है। मानव मन, जैसा कि यह बहुत अच्छा है, इतनी अधिक जानकारी को संभालने में असमर्थ है। जैव सूचना विज्ञान एक संकर क्षेत्र है जो जीव विज्ञान के ज्ञान और सूचना विज्ञान के ज्ञान को एक साथ लाता है, जो कंप्यूटर विज्ञान का एक उप-क्षेत्र है।
जीनोम में बहुत सारी जानकारी होती है
जीवों के जीनोम बहुत बड़े होते हैं। अनुमान है कि मानव जीनोम में तीन अरब आधार जोड़े होते हैं जिनमें लगभग 25,000 जीन होते हैं। तुलना के लिए, फल मक्खी में 165 बिलियन बेस जोड़े होने का अनुमान है जिसमें 13,000 जीन होते हैं। इसके अतिरिक्त, जीनोमिक्स के एक उपक्षेत्र को ट्रांसक्रिपटॉमिक्स अध्ययन कहा जाता है, जो जीन, एक में हजारों की संख्या में होता है जीव, एक निश्चित समय पर, कई समय बिंदुओं पर, और प्रत्येक पर कई प्रयोगात्मक स्थितियों में चालू या बंद होते हैं टाइम पॉइंट। दूसरे शब्दों में, "ओमिक्स" डेटा में बड़ी मात्रा में जानकारी होती है जिसे मानव मन जैव सूचना विज्ञान में कम्प्यूटेशनल विधियों की सहायता के बिना समझ नहीं सकता है।
जैविक डेटा
आनुवंशिक अनुसंधान के लिए जैव सूचना विज्ञान महत्वपूर्ण है क्योंकि आनुवंशिक डेटा का एक संदर्भ होता है। संदर्भ जीव विज्ञान है। जीवन रूपों में व्यवहार के कुछ नियम होते हैं। यही बात ऊतकों और कोशिकाओं, जीनों और प्रोटीनों पर भी लागू होती है। वे कुछ खास तरीकों से बातचीत करते हैं और कुछ खास तरीकों से एक दूसरे को नियंत्रित करते हैं। बड़े पैमाने पर, जटिल डेटा जो जीनोमिक्स में उत्पन्न होता है, वह प्रासंगिक ज्ञान के बिना समझ में नहीं आता कि जीवन कैसे काम करता है। जीनोमिक्स द्वारा उत्पन्न डेटा का विश्लेषण इंजीनियरों और भौतिकविदों द्वारा उपयोग की जाने वाली समान विधियों द्वारा किया जा सकता है जो अध्ययन करते हैं वित्तीय बाजार और फाइबर ऑप्टिक्स, लेकिन डेटा का विश्लेषण इस तरह से करने से समझ में आता है कि इसके ज्ञान की आवश्यकता है जीव विज्ञान। इस प्रकार, जैव सूचना विज्ञान ज्ञान का एक अमूल्य संकर क्षेत्र बन गया।
हजारों की संख्या में क्रंचिंग
नंबर क्रंचिंग यह कहने का एक तरीका है कि कोई गणना कर रहा है। कंप्यूटर कितनी तेजी से सूचनाओं को प्रोसेस कर सकता है, इस पर निर्भर करते हुए बायोइनफॉरमैटिक्स कुछ ही मिनटों में हजारों नंबरों को क्रंच करने में सक्षम है। ओमिक्स अनुसंधान बड़े डेटा सेट में पैटर्न खोजने के लिए बड़े पैमाने पर एल्गोरिदम - गणितीय गणना - चलाने के लिए कंप्यूटर का उपयोग करता है। सामान्य एल्गोरिदम में पदानुक्रमित क्लस्टरिंग (संदर्भ 3 देखें) और प्रमुख घटक विश्लेषण जैसे कार्य शामिल हैं। दोनों नमूनों के बीच संबंध खोजने की तकनीकें हैं जिनमें कई कारक हैं। यह निर्धारित करने के समान है कि फोन बुक में दो वर्गों के बीच कुछ जातीयताएं अधिक आम हैं: अंतिम नाम जो ए बनाम अंतिम नाम से शुरू होते हैं जो बी से शुरू होते हैं।
सिस्टम बायोलॉजी
जैव सूचना विज्ञान ने यह अध्ययन करना संभव बना दिया है कि एक प्रणाली जिसमें हजारों गतिमान भाग होते हैं, एक साथ चलने वाले सभी भागों के स्तर पर कैसे व्यवहार करते हैं। यह पक्षियों के झुंड को एक साथ उड़ते हुए देखने जैसा है या मछली के एक स्कूल को एक साथ तैरते हुए देखना है। पहले, आनुवंशिकीविदों ने एक समय में केवल एक जीन का अध्ययन किया था। यद्यपि उस दृष्टिकोण में अभी भी अविश्वसनीय रूप से योग्यता है और ऐसा करना जारी रहेगा, जैव सूचना विज्ञान ने नई खोजों को बनाने की अनुमति दी है। सिस्टम बायोलॉजी एक जैविक प्रणाली का अध्ययन करने के लिए एक से अधिक गतिमान भागों की मात्रा निर्धारित करके एक दृष्टिकोण है, जैसे पक्षियों की विभिन्न जेबों की सामूहिक गति का अध्ययन करना, जो एक बड़े के रूप में उड़ रहे हैं, घूम रहे हैं झुंड