زیستدادهورزی یا بیوانفورماتیک دانش استفاده از علوم کامپیوتر و آمار و احتمالات در شاخه زیستشناسی مولکولی است. در چند دههٔ اخیر، پیشرفت در زیستشناسی مولکولی و تجهیزات مورد نیاز تحقیق در این زمینه باعث افزایش سریع تعیین توالی ژنوم بسیاری از گونههای موجودات شد، تا جایی که پروژههای تعیین توالی ژنومها از پروژههای بسیار رایج به حسب میآیند. امروزه توالی ژنوم بسیاری از موجودات ساده مانند باکتریها تا موجودات بسیار پیشرفته چون یوکاریوتهای پیچیده شناسایی شدهاست. پروژهٔ شناسایی ژنوم انسان در سال ۱۹۹۰ آغاز شد و در سال ۲۰۰۳ پایان یافت و اکنون اطلاعات کامل مربوط به توالی هر ۲۴ کروموزوم انسان موجود است.
گسترش روزافزون حجم عظیم دادههای ژنومی و نیاز به ذخیره، بازیابی و تحیل مناسب این دادهها، موجب پیدایش علم بیوانفورماتیک گردید. این دانش نوظهور، به عنوان یک دانش بین رشتهای، تلاش میکند تا با استفاده از تکنیکهای موجود در علوم کامپیوتر، ریاضیات، ژنتیک، شیمی، فیزیک و علوم مرتبط دیگر، مسایل مختلف زیستشناختی را که معمولاً در سطح مولکولی هستند حل کند. تلاشهای پژوهشی اصلی در این رشته عبارتند از: تطابق توالی، کشف ژن، گردآوری ژنوم، تنظیم ساختار پروتئینی، پیش بینی ساختارهای دوم و سوم پروتئین، پیشبینی بیان ژن و تعاملات پروتئین- پروتئین و مدلسازی تکامل.
واژههای بیوانفورماتیک و زیستشناسی محاسباتی اغلب بهجای یکدیگر بهکار میروند. بههرحال بیوانفورماتیک، بهگونه مناسبتری به ایجاد و توسعه الگوریتمها، تکنیکهای محاسباتی و آماری و تئوری اشاره میکند که برای حل مسایلی رسمی و عملی بهکار میروند که توسط مدیریت و تحلیل دادههای زیستشناختی مطرح شده یا از آن الهام میگیرند. از طرف دیگر زیستشناسی محاسباتی به تحقیق مبتنی بر فرضیه در مورد یک مسئله خاص زیستشناسی با استفاده از پردازش رایانه میپردازد که با دادههای عملی و شبیهسازی شده انجام میشود و با هدف اصلی کشف و توسعه دانش زیستشناختی همراه است. تحقیق در زیستشناسی محاسباتی، با زیستشناسی سیستمها همپوشانیهایی دارد. تمایز مشابهی توسط موسسه ملی سلامت آمریکا در کار بر روی تعریف بیوانفورماتیک و زیستشناسی محاسباتی انجام شدهاست که در آن تأکید بیشتر بر این است که پیوند محکمی از پیشرفتها و دانش میان تحقیقات بیشتر مبتنی بر فرضیه زیستشناسی محاسباتی و پژوهش مبتنی بر تکنیک بیوانفورماتیک وجود دارد. همچنین زیستشناسی محاسباتی شامل دو زیرشاخه کمتر شناخته شده ولی به یک اندازه مهم است: بیوشیمی محاسباتی و بیوفیزیک محاسباتی.
یک خط مشترک در بیوانفورماتیک و زیستشناسی محاسباتی، استفاده از ابزارهای ریاضی و آماری برای استخراج اطلاعات مفید از دادههای تولیدشده توسط تکنیکهای زیستشناختی با برونده بالا نظیر توالی ژنوم است. یک مسئله نمونه در بیوانفورماتیک، گردآوری توالی ژنوم با کیفیت بالا از یک توالی DNA تکهتکه شده تفنگ ساچمهای(Shotgun sequencing) است. دیگر مسایل معمول عبارتند از مطالعه قواعد ژن با استفاده از دادههایی از ریزآرایهها (Microarray) یا طیفسنجی جرمی (Mass Spectophotometry).
گسترش روزافزون حجم عظیم دادههای ژنومی و نیاز به ذخیره، بازیابی و تحیل مناسب این دادهها، موجب پیدایش علم بیوانفورماتیک گردید. این دانش نوظهور، به عنوان یک دانش بین رشتهای، تلاش میکند تا با استفاده از تکنیکهای موجود در علوم کامپیوتر، ریاضیات، ژنتیک، شیمی، فیزیک و علوم مرتبط دیگر، مسایل مختلف زیستشناختی را که معمولاً در سطح مولکولی هستند حل کند. تلاشهای پژوهشی اصلی در این رشته عبارتند از: تطابق توالی، کشف ژن، گردآوری ژنوم، تنظیم ساختار پروتئینی، پیش بینی ساختارهای دوم و سوم پروتئین، پیشبینی بیان ژن و تعاملات پروتئین- پروتئین و مدلسازی تکامل.
واژههای بیوانفورماتیک و زیستشناسی محاسباتی اغلب بهجای یکدیگر بهکار میروند. بههرحال بیوانفورماتیک، بهگونه مناسبتری به ایجاد و توسعه الگوریتمها، تکنیکهای محاسباتی و آماری و تئوری اشاره میکند که برای حل مسایلی رسمی و عملی بهکار میروند که توسط مدیریت و تحلیل دادههای زیستشناختی مطرح شده یا از آن الهام میگیرند. از طرف دیگر زیستشناسی محاسباتی به تحقیق مبتنی بر فرضیه در مورد یک مسئله خاص زیستشناسی با استفاده از پردازش رایانه میپردازد که با دادههای عملی و شبیهسازی شده انجام میشود و با هدف اصلی کشف و توسعه دانش زیستشناختی همراه است. تحقیق در زیستشناسی محاسباتی، با زیستشناسی سیستمها همپوشانیهایی دارد. تمایز مشابهی توسط موسسه ملی سلامت آمریکا در کار بر روی تعریف بیوانفورماتیک و زیستشناسی محاسباتی انجام شدهاست که در آن تأکید بیشتر بر این است که پیوند محکمی از پیشرفتها و دانش میان تحقیقات بیشتر مبتنی بر فرضیه زیستشناسی محاسباتی و پژوهش مبتنی بر تکنیک بیوانفورماتیک وجود دارد. همچنین زیستشناسی محاسباتی شامل دو زیرشاخه کمتر شناخته شده ولی به یک اندازه مهم است: بیوشیمی محاسباتی و بیوفیزیک محاسباتی.
یک خط مشترک در بیوانفورماتیک و زیستشناسی محاسباتی، استفاده از ابزارهای ریاضی و آماری برای استخراج اطلاعات مفید از دادههای تولیدشده توسط تکنیکهای زیستشناختی با برونده بالا نظیر توالی ژنوم است. یک مسئله نمونه در بیوانفورماتیک، گردآوری توالی ژنوم با کیفیت بالا از یک توالی DNA تکهتکه شده تفنگ ساچمهای(Shotgun sequencing) است. دیگر مسایل معمول عبارتند از مطالعه قواعد ژن با استفاده از دادههایی از ریزآرایهها (Microarray) یا طیفسنجی جرمی (Mass Spectophotometry).