قراءة
عرض

Bioinformatics المعلوماتية الحيوية


الكورس الاول / الثاني فيزياء حياتية

الدكتور عبدالرحيم ذنون الغزال
bakurius@yahoo.com
المصدر
كتاب /المعلوماتية الحيوية
دكتورة زهرة محمود الخفاجي والدكتور علي عبد الحافظ إبراهيم
معهد الهندسة الوراثية والتقنيات الحيوية قسم التقنيات الحيوية \ كلية العلوم \
للدراسات العليا \ جامعة بغداد جامعة النهرين \ العراق
2012

مقدمة

مختلف جوانب الحياة وذلك بسبب التشعب الكبير للمعلومات العلمية بمختلف العلوم ، فهناك Informatics دخلت تقنيات المعلوماتية
Immunoinformatics والمناعية Chemoinformatics والمعلوماتية الكيماوية Bioinformatics المعلوماتية الحيوية
وغيرها, كل هذه الفروع ادت الى تجمع كبير للمعلومات بحيث اصبحت عملية السيطرة عليها مستحيلة لذا ظهر علم جديد هو علم المعلوماتية الحيوية الذي ياخذ على عاتقه جمع وتبويب واختصار وجدولة هذه المعلومات وجعلها سهلة المنال في اي وقت على النت ومن اي مكان بالعالم ومن هنا تكمن اهمية هذا العلم.


.

Bioinformatics المعلوماتية الحيوية

قد لا يوجد تعريف واضح المعالم وقياسي لهذا الحقل ولكن يمكن القول انه "الادارة والتعامل والاستغلال للمعلومات الحيوية باستعمال طرق الحاسوب"، لذا يكون الحقل أحد حقول المعرفة المتداخلة بين العلوم.
ويتضح انه دمج بين علوم الحياة المختلفة وعلوم الحاسوب، ولكن المجال
وبذا يمكن ان يطلق عليه Molecular biology يخص العلوم الجزيئة على وجه الخصوص
والذي يضم بين جنبيه Computational molecular biology اسم علم الحياة الحاسوبي
وغيرها لتصب Bioimaging والتصوير الحيوي Biosimulation عمليات المحاكاة الحيوية
في النهاية الى ادارة وتحليل المعلومات الحيوية.
،DNA

ومن هذا يتضح ان علم المعلومات الحيوية تكون من الاسباب التالية 1-نتيجة تحليل الجزيئات الحيوية العملاقة مثل
ومن خلال وظيفتهما يتم إنتاج البروتينات. RNA
2-نتيجة قيام علم الحاسوب بترتيب وتصنيف هذه المعلومات لغرض إيجاد أنماطا" لتحليلها واستغلال المعلومات
لذا فهو يساعد في الكشف عن حقائق بايولوجية جديدة تساعد ، Data biomining التي فيها
في توحيد علوم الحياة

أهمية المعلوماتية الحيوية

تظهر أهمية المعلوماتية الحيوية من خلال: 1- ازدياد الاهتمام بها على كافة الأصعدة 2-دخولها المؤسسات التعليمية العالية المستوى
، مثل أ- الدراسات الأولية
ب- الدراسات العليا
ج -مجالات البحوث العلمية على مختلف مشاربها،
د – خصصت لها الأقسام العلمية الخاصة بها وكذلك الكليات
ووصل البعض الى إنشاء جامعات خاصة بها لتخريج كوادر تعمل في هذا المجال،
ه – خصصت لها التخصيصات المالية و- تم استحداث درجات علمية خاصة بهذا العلم.
و - بناء موديلات حاسوب للخلايا الحية وشبكات أيضها
In silico وتطبيق المحاكاة الحاسوبية Wet-lab-data الداخلية بالاعتماد على تجارب المختبر
لتحسين الحاصل والإنتاجية في حالة إجراء دراسات الصناعات الحيوية عند simulation
استخدام الأحياء المجهرية .
على سبيل المثال، ومن هنا نشأ ما يسمى التقنية الحيوية الحاسوبية
للوصول الى أفضل الظروف المثالية – النظرية– قبل بدء In silico biotechnology
عمليات الإنتاج الفعلي للعديد من المواد مثل الأدوية وغيرها.


ز - استعمال الوسائل الحيوية
) Databases لاستغلال المعلومات المتشعبة والكثيرة التي ادخلت في قواعد البيانات
والتي تتم بطرق مختلفة. ومن هذه المعلومات التي ادخلت في قواعد بيانات المعلوماتية الحيوية هي:1- التعرف على مواقع الجينات في تواليات
2- تحديد تركيب البروتينات الناتجة من الجينات 3- تحديد التواليات (DNA sequencesو DNA
4- تحديد المنطقة المشفرة في الجينات وتحديد قابلية ترجمتها ) Coding sequences و Coding genes المشفرة
لإعطاء البروتينات) ، 5- تحديد التركيب الخاص للبروتين الناتج من التشفير 6- تحديد الوظائف للبروتين الناتج من التشفير ، 7-القيام
لنواتج الجينات بعد التعبير عنها. 8- هذا يؤدي بمجمله الى Clustering بعمليات التجميع والعنقدة
فهم فعالية الخلايا الحية وكيفية القيام بوظائفها على المستوى الجزيئي لغرض
استغلالها بالنحو الأمثل.

أسباب تطور المعلوماتية الحيوية

من الواضح للعيان زيادة المعلومات في مجال علم الحياة وخاصة على المستوى الجزئي بشكل
هائل جدا ومذهل، فمثلا يتضاعف عدد الجينومات التي يحدد تواليها والمودعة في مراكز خزن
المعلومات حوالي مرة سنوياً او أقل من سنة، ومن هذا المنطلق أخذت بعض المؤسسات المعنية
Genomes of the " على عاتقها مابلي 1- أصدار نشرات دورية شهرية او تقارير شهرية تحت عنوان
وتقوم هذه المؤسسات بتدقيق المعلومات وإزالة المكرر منها وتهميشها "month
من هامش او توضيح) ، 2- توضيح كل المعلومات المتوفرة لكل جينوم وذكر ) Annotation
وترجمتها الى بروتينات وإجراء المقارنات (DNA) طرق التشذيب وبرمجة تواليات الجينوم
بين التواليات الجديدة مع تلك المودعة في قواعد البيانات

3- وضع الصور التوضيحية للتواليات

ثم بعد ذلك إيداعها ،Phylogenetic trees والرسومات الخاصة بأشجار العلاقات التطورية
في قواعد البيانات الخاصة بكل مركز. 4-وضع روابط على شبكة الانترنت
5-وضع معلومات إضافية قد يحتاجها Web sites توصل المستخدم الى مواقع الكترونية
الباحث لإجراء الدراسة والسلالة التي قد يحتاج تواليها وغيرها من المعلومات.


اذن الزيادة في المعلومات هي الدافع الرئيس وراء تطور المعلوماتية الحيوية ،
ولكن من الأسباب الأخرى المهمة ان الزيادة قد لا تعني شيئا ان لم يكن بالإمكان الاستفادة
منها، ومن هنا جاءت الحاجة للوصول الى البيانات واستخدامها واستغلالها واستخلاص المفيد
منها. فعملية البحث في البيانات المتكررة والكبيرة والتي يصل البعض منها الى آلاف الصفحات
تفوق القدرات البشرية فضلا عن انها مملة وتستغرق الوقت الطويل وتحتاج الى عمليات
رياضية معقدة لذلك كان لابد من إيجاد وسيلة جديدة للسيطرة على المعلومات فظهر علم المعلوماتية الحيوية.
توفر الإمكانات لتحليل Bioinformatic tools ومن جهة ثانية فان وسائل المعلوماتية الحيوية
النتائج وربطها واستخلاص العبر منها، وذلك مما حدا ببعض العاملين الى توقع إحلال
المعلوماتية الحيوية بشقها المتعلق بالشبكة العنكبوتية ان يحل محل التجارب المختبرية – وهذا
بطبيعة الحال غير ممكن- لان الكثير من تنبؤات الحاسوب يكون الفيصل فيها هو الواقع التجريبي

فالعمل ألمختبري يحتاج الى طرق عمل وأدوات للتعامل مع المواد الحيوية وهي التي
تمثل ارض الواقع ، لتدخل في مجالات المعلوماتية الحيوية التي تكون أدواتها لغات البرمجة
وقواعد البيانات وتقنيات الحاسوب لتتعامل مع ارض الواقع المذكور آنفاً.
تطور ومهام المعلوماتية الحيوية
مما ذكر أعلاه حول تعدد مشارب ومصادر المعلوماتية الحيوية ، يمكن القول ان كل علم
يساهم بجزء معين من المهام التي تقوم بها المعلوماتية الحيوية فلو تم البدء بالجوانب الحيوية
وبأخذ نظرة تاريخية مبسطة في هذا الجانب يلاحظ ان زيادة عدد الجينومات التي تم تحديد
.

تواليها يزداد باضطراد فمثلا:

الذي يضم 39,937 زوج من T7 Bacteriophage 1-في عام 1983 تم تحديد توالي العاثي ·
وينتج عددا" من البروتينات. (base pair = bp) القواعد النتروجينية
Haemophilus 2-في عام 1995 تم تحديد توالي جينوم السلالات الحرة المعيشة للبكتريا ·
وكان مؤلفاً من 1,830,137 زوج قواعد. influenzae RdW20
والتي تعد أحد Caenorhabditis elegans 3-في عام 1996 تم تحديد توالي جينوم الدودة ·
النماذج الدراسية وكان مكوناً من 95,078,296 زوج من القواعد ويضم ما يقرب من 19,009
جين.
الذي Escherichia coli K- 4-في عام 1998 تم تحديد توالي جينوم أحد سلالات البكتريا 12 ·
Open reading كان بطول 4,639,221 قاعدة ويضم 4293 من أطر القراءة المفتوحة
اي المناطق المشفرة للبروتينات. frame
Drosophila melanogaster 5-في عام 2000 تم تحديد توالي الجينوم الكامل لذبابة الفاكهة ·


النموذج الدراسي) ليكون عدد أزواج القواعد فيه 116,117,226 متضمناً 13,601 جين.
وتضمن Homo sapiens في آذار 2003 أعلن عن اكتمال تحديد الجينوم البشري ·
3,201,762,551 من القواعد وأعلن في وقتها انه يحوي على 31,780 جين (ولكن هذه
الأرقام عرضت للتمحيص والتعديل لتكون أقل من ذلك
في نهاية ثمانينيات Human genome project وكان قد بدأ تحديد الجينوم البشري
القرن المنصرم وكان المحفز الكبير لتطوير المعلوماتية الحيوية التي توسع استعمالها عبر
الانترنت او الشبكة العنكبوتية العالمية في التسعينات هذا فضلا عن الكم الهائل من المعلومات
في مجال علوم الحياة الأخرى التي أسفرت عنها تجارب المختبر

.

والحقيقة ان مصطلح المعلوماتية الحيوية قد استعمل مؤخراً بشكله الرسمي اما واقعه العملي فقد
أول قاعدة معلومات لتوالي Margaret O. Dayhoff بدأ من الستينات عندما وضعت الباحثة
البروتينات في أطلس خاص بتواليات وتركيب البروتينات ضمن سلسلة من الإصدارات
استمرت الى منتصف سبعينات القرن الماضي ، وكان عندها عدد التواليات يزيد قليلا عن
العشرة مقارنة بالتواليات في الوقت الحاضر التي تصل الى عشرات الآلاف .
ورافقت ذلك (من الناحية التاريخية) وضع برنامج عام 1970 من قبل
لمقارنة التواليات البروتينية والتي كانت خطوة أساسية لمقارنة التواليات، تلتها بعد Wunsch
تركيب البروتينات والذي كان Prediction ذلك وضع برنامج عام 1974 للتنبؤ او حدس
منطلقا لعدد كبير من برامج التنبؤ بتركيب البروتينات


ومن الناحية التاريخية شهدت ثمانينيات القرن الماضي تطورا" سريعا" في وضع قواعد البيانات
. BLAST و FASTA ووضع برامج للبحث فيها مثل
ولذلك فان العاملين في مجال الحاسوب والرياضيات أخذوا على عاتقهم تطوير الجوانب
الخاصة بهم ليواكبوا التطورات في المجال الحيوي، وبذا أصبحت وسائل الحاسوب
والرياضيات جزءا مهما من علوم الحياة الحديثة أي ان المعلوماتية الحيوية أصبحت جزاءا"مهما
في مختبرات علوم الحياة ، وهذا يتضح من ان المعلوماتية الحيوية التي بدأت بسيطة في بداية
الستينات توسعت نتيجة للتوسع المتوازي بين علوم الحياة وعلوم الحاسوب. وقد كانت هناك
تحديات كبيرة أمام علوم الحاسوب أدت في النهاية – ربما– الى جلب علوم الحاسوب بشكل
أقرب الى مجال الاكتشافات العلمية والتي منها علوم الحياة، وهذا يتطلب التطبيق الأمثل
فضلا عن وضع البرامج الملائمة للجوانب والحقائق في مجال علوم الحياة. ووضع
والبرامج وإدخال الإحصاء بشكل فاعل فيها للتوصل الى العلاقات Algorithms الخوارزميات
بين مجاميع البيانات.

مما تقدم يتضح ان المعلوماتية الحيوية فضلا عن الجوانب الحيوية تحتاج الى:
1-خزن البيانات وهذا يتمثل بإنشاء قواعد البيانات على مختلف أنواعها. ·
2-استرجاع البيانات المخزونة باستخدام وسائل مختلفة. ·
للمعلومات الموجودة عن جزئيات الحياة سواء Manipulation 3-استخدام وسائل للتلاعب ·
او البروتينات. RNA ، DNA كانت

تاثير الانترنيت على المعلوماتية الحيوية

منذ تسهيل مهمة استعمال الانترنيت – ربما – للجميع في تسعينات القرن المنصرم زاد انتشار
وتبادل المعلومات الحيوية والتي كان لها التأثير الكبير في تطور علوم الحياة الحديثة والجزيئية
على وجه الخصوص، فقد كان الانفجار الهائل في تحديد تواليات الجينومات الدافع وراء الزخم
الكبير الى إيجاد برامج الحاسوب لتحليل الكم الهائل من المعلومات.
تاثير الإحصاء على المعلوماتية الحيوية
يشكل الإحصاء أحد الدعائم الأساسية للمعلوماتية الحيوية ، فالكم الكبير من المعلومات ومحاولة
مقارنتها واستنباط الاستنتاجات منها يحتاج الى عمليات إحصائية، تكون في بعض الاحيان
معقدة جدا.
ودخول الإحصاء الى مجال المعلوماتية الحيوية ضروري ولكنه جلب معه احتمالاته ومصفوفاته
الترجيحية وغيرها من الجوانب والتي لابد منها عند التعامل مع المعلومات الكثيرة، لذلك يلاحظ
ان الإحصاء يدخل في كل مجال وكل برنامج او خوارزمية لغرض وضع المستخدم على بينة واضحة من الدقة الحسابية والاحصائية


.
الحاسوب والمعلوماتية الحيوية
العديد من المهام في المعلوماتية الحيوية تحتاج الى الإعادة ربما ملايين من المرات، فمثلا
جديد يحتاج ان يقارن بكل التواليات المخزونة في قواعد البيانات، Sequence مقارنة توالي
فضلا عن الحاجة في بعض الأحيان الى مقارنة العديد من التواليات مع بعضها لمعرفة العلاقة
فيما بينها وهذه تكون أكبر من القدرات البشرية لذلك يستعمل Phylogenetic التطورية
الحاسوب في حل هذه العمليات، وكذلك يستعمل الحاسوب لحل مشاكل طوي البروتينات
بعد معرفة توالي الحوامض الامينية فيه، او استنتاج المسار الأيضي Protein folding
وغيرها من العمليات، RNA بعد تزويده بنسق التعبير بشكل Metabolic pathway
من هذا يبدو واضحا ان وسائل الحاسوب تعتمد بعد او ما وراء المعلومات الحيوية على المعرفة
بالرياضيات وعلم الإحصاء وتقنيات المعلوماتية.

المعلوماتية الحيوية مقابل المنظومة البايولوجية

Bioinformatics vs systems biology
المعلوماتية الحيوية تتعامل مع الأنظمة الحيوية على المستوى الجزئي بشكل أساسي ولذلك عدها
البعض انها علم الحياة الجزيئي الحاسوبي. وفي حين يتعامل مجال المنظومات
البايولوجية مع مجالات أوسع تخص مجتمعات الكائنات وتداخلاتها مع ما يحيطها، فهي تشمل
Mathematical modeling and 1-إيجاد الموديلات الرياضية في الأنظمة البيئية
2-دراسة داينميكية المجتمعات 3-تطبيق تأثير الجينات في التصرفات ،ecosystems
التي يبديها المجتمع، 4-إيجاد وبناء العلاقات التطورية بالاعتماد على سجلات
الحفريات باستعمال وسائل الحاسوب،
ومن النظر الى أعلاه يلاحظ ان كل من المعلوماتية الحيوية ودراسات المنظومات البايولوجية
هي تهدف في النهاية الى هدف مشترك لفهم الأنظمة الحيوية وربما نقلها من المجال النوعي
الى المجال الكمي.


مرافقات المعلوماتية الحيوية
رافقت تطورات المعلوماتية الحيوية في الجوانب العملية ما يقابلها في الجوانب النظرية
والذي يدرس omics الجامعة لكل علم يسمى بتعبير ينتهي بالمقطع والمصطلحات التي تصف المعلومات، وتمثلت هذه بالدراسة
والذي يمثل كل المحتويات Genome فظهر مصطلح –ome المصطلحات الكاملة المقابلة
الوراثية للكائن من حيث التركيب والترتيب والوظائف وغيرها من المعلومات تدرس ضمن
وتفرعت عن ذلك دراسات ثانوية مثل دراسات الجينوم .Genomics حقل دراسة الجينوم
الذي يهدف الى1- الكشف عن الدور الوظيفي للجينات Functional genomics الوظيفية
المختلفة 2-كيفية أدائها للوظائف 3-تداخلها مع بعضها البعض ضمن الشبكات الخلوية. وكذلك
التي تهتم بالنواحي التركيبية ، Structural genomics مصطلح الدراسات الجينومية التركيبية
وتعنى بمقارنة الجينومات لاستنباط Comparative genomics ودراسات الجينوم المقارنة
التشابه والاختلاف وغيرها من الأغراض.

وعلى غرار الدراسات الجينومية ظهر مصطلح مكنون النسخ
وهو دراسة الحامض الرسولTranscription ويبحث في دراسة ما ينتج عن الانتساخ Transcriptomics
التنظيمي. DNA للتعرف على 1-المعلومات الوراثية 2-على التعبير الجيني 3-دور بعض تواليات RNA
والمجال الذي يعنى بدراسته دراسة مكنون البروتين Proteome اما المكنون البروتيني
التي يشفر لها عبر المرور DNA فهو يدرس 1-منتجات الجينات 2-تواليات Proteomics
وتمثل دراسات المكنون البروتيني العديد من الجوانب بدءاً من1- تحدد .(RNA بمكنون النسخ
تواليات الحوامض الامينية في الببتيدات او البروتينات 2-دراسة صفات وفعاليات على
البروتينات الناتجة وغيرها من الجوانب.


فيهتم بدراسة Metabolomics ونطاق دراسته Metabolome ومصطلح مكنون الايض
في الخلايا والأنسجة والسوائل الحيوية، Metabolites التحليل الكمي والنوعي لكل المتأيضات
والذي يعمل في التوجه نفسه ولكن في الأنظمة Metabonomics وهناك مصطلح قريب منه
المعقدة ومجال كشف الأدوية.
والحقيقة ما ذكر أعلاه يعد الجوانب الرئيسة في المستجدات التي رافقت المعلوماتية الحيوية.
والذي Physiome ولكن كل المصطلحات يمكن ان تذكر بشكل كامل مثل دراسة الفسلجة
الذي يعنى بدراسة أطر القراءة المفتوحة (المناطق ORFome (Open reading frame) يعنى بالجوانب الفسلجية و
المشفرة للبروتينات من الجينوم) وهناك العديد من هذه المصطلحات سيتم ذكرها تباعا

تطبيقات المعلوماتية الحيوية

من الواضح ان تطبيقات المعلوماتية الحيوية واسعة وهي تتسع يوماً بعد آخر، وفي التالي ذكر
لبعض الجوانب:
1-في مجالات الدراسات الأكاديمية أصبحت ضرورة لابد منها، 2-تحليل ·
تركيب الحوامض الامينية 3-تحليل البروتينات، 4-دراسة التراكيب المختلفة بالمقارنة 5-دراسة عمليات الاصطفاف
لغرض تصنيفها 6-التنبؤ بوظائف التراكيب المختلفة للبروتينات والاحماض النووية بالاعتماد على التركيب فضلا عن تحديد Alignments
وتحديد Gene expression profile التحليل الوظيفي مثل تحديد نسق التعبير الجيني
8-التنبؤ بتداخلات البروتينات مع بعضها، 9-تحديد مواقع Promoters 7-تحديد الممهدات
البروتينات في الخلايا، 10-من كل هذه المعلومات يمكن تصميم المسارات الايضية ومحاكاتها.
11-تصنيف العمليات وتجميعها مع بعضها مثل عنقدة التعبير
والذي يحتاج الى إيجاد شجرة علاقات تطورية Gene expression clustering الجيني
معتمدة على تواليات الجينات.


وبالإضافة الى ذلك يلاحظ ان تداخل الفعاليات للبروتينات يحتاج الى 1-التعرف على الممهدات
2- التعرف على المناطق المشفرة وغير المشفرة (المنظمة) -معرفة كل هذه التداخلات والشبكات يمكن ان
يفضي الى مجالات للتطبيقات الأخرى مثل :
1-التطبيقات في مجال تصنيع الأدوية التي تعتمد على معرفة ارتباط البروتينات بالربائط ·
D-structures 2-التراكيب ثلاثية الأبعاد للبروتينات Ligands
3- تسهيل الطريق لتطوير الأدوية وبكفاءة أعلى وبأقل ما يمكن من التأثيرات
الجانبية. 4-تحديد الأهداف غير المستغلة في
Genomic الأحياء الممرضة لتكون أهدافا للأدوية كما في طريقة الطرح الجينومي
اذ تتم عمليات اصطفاف لجينومات الأحياء المرضية مع جينومات ، subtractive approach
المضيف، 5-معرفة المناطق او التواليات غير المتشابهة ليتم العمل عليها، بدلا من استعمال
الطرق التقليدية التي تطول الى سنوات لاكتشاف دواء واحد.

6-في مجالات الطب الجنائي والتي أصبحت مقبولة في ·

المحاكم والجهات المختصة بعد إخضاع التواليات الى عمليات إحصائية صارمة، سواء في
تحديد الجرائم او إثبات النسب.
7-تستخدم المعلوماتية الحيوية في مجالات التصنيع الحيوي او التقنيات الحيوية ، لإيجاد أفضل ·
السلالات المنتجة7- دراسة أفضل الظروف لعمليات الإنتاج
المحاصيل التي تكون لها إنتاجية عالية او تكون ذات مقاومة عالية
للظروف 8-استخدمت وسائل المعلوماتية الحيوية بشكل فاعل في مجالات الزراعة ، اذ ان وجود قواعد ·
البيانات لجينومات النباتات وتحاليل التعبير الجيني لها لعبت دورا مهما في تطوير أنواع
وضروب مختلفة من البيئية القاسية او مقاومة للإصابة بالأمراض والآفات وغيرها من الصفات التي يرغب
بها المستهلك.
9- في مجال العناية الصحية والشخصية، ومن التوقعات في هذا ·
المجال ان يقوم الطبيب بتحليل تواليات جينوم المريض بالسرعة الممكنة واستعمال وسائل
المعلوماتية الحيوية لتحديد وتشخيص الطفرات المؤذية ومثل هذا سيساعد في التشخيص المبكر
ومن ورائه المعالجة المبكرة.


بعض المساوئ في المعلوماتية الحيوية
المعلوماتية الحيوية وان كانت تعتمد بشكل كبير على التجارب
المختبرية.،
والتجارب المختبرية تعتبر ذات مصداقية عالة جدا بسبب
1-اعتمادها على المعلومات الخام والأولية لتجرى عليها التجارب
2- إعطاء التفسيرات الملائمة للمعلومات التجريبية
3-إجراء المزيد من التجارب لإثباتها.
لكن المعلوماتية الحيوية تعتمد على مسألة الاحتمالية والتنبؤ او الحدس التي
فرضت واقع وجود الإحصاء بشكل كبير تمثل أحد الجوانب التي تؤدي الى حصول نتائج سلبية في
المعلوماتية الحيوية لان التنبؤات التي تقوم بها وسائل المعلوماتية الحيوية هي
ليست برهان موثق الى درجة كبيرة لأي فكرة وعليه فهي لا يمكن ان تحل محل طرق إجراء
التجارب المختبرية التي تقوم باختبار الفرضيات.

وعليه فان العديد مما تقدمه المعلوماتية الحيوية يكون غير قادرا على عكس الحقيقة، فبعض
الأحيان تعطي تنبؤ لا يمت الى مجال علوم الحياة بصلة. ويعكس هذا الدقة التي أجريت بها
الاختبارات التجريبية وذلك لان :
الأخطاء التي تحصل في المجال التجريبي تنعكس على الاستنتاجات فأذن جودة الاستنتاجات ·
تعتمد على جودة العمل التجريبي، فاذا كان هناك خطأ تجريبي في تحديد التواليات او تهميشها
ستكون مضللة، لذا كان الحذر الشديد في Downstream analysis وتوضيحها فان النتائج
العمل التجريبي الذي هو سيد الموقف وهو الذي يعتمد عليه في اخذ المعلومات وادخالها الى منظومات المعلوماتية الحيوية.


العوامل المؤثرة على جودة المعلوماتية الحيوية
تعتمد جودة المعطيات والاستنتاجات من وسائل المعلوماتية الحيوية على: 1- الحواسيب المستعملة، ·
فهناك العديد من البرامج التي تكون بطيئة التنفيذ باستعمال الحواسيب العادية
2- نوع البرامج المستخدمة حيث ان استعمال برامج سريعة مهمة لان علاقة السرعة العكسية مع الدقة معروفة.
3-نوعية البرامج لها دخل كبير في التقليل من كفاءة المعلوماتية الحيوية فاليوم هناك عشرات ·
وعشرات البرامج لمختلف الأغراض ولكنها يمكن ان تعطي مستوى من الأخطاء غير مسموح
به.
4- الاعتماد على برنامج واحد يسبب العديد من المساوئ في توثيق النتائج، لذا استخدام اكثر من برنامج مهم جدا
5-دراسة الأسس التي يعمل بها البرنامج ومدى ثقلها الحيوي لتحديد الصفات ، فالعديد من البرامج
المعلن عنها وعن صفاتها الخارقة قد لا تكون كذلك.

ماذا يحتاج العامل في مجال المعلوماتية الحيوية ؟

بسبب كون المعلوماتية الحيوية هي نتاج لخليط من عدة علوم لذا كان لابد ان يكون للعامل في هذا العلم معلومات عن كل هذه العلوم والتي تشمل اختصاصات مختلفة لتساعد في التوصل الى لغة علمية مشتركة يمكن التفاهم بها، خاصة العاملين في علوم الحياة اللذين يعتمدون على التجارب المختبرية والعاملون في مجال الحاسوب اللذين يريدون ان يتم كل شيء وفق برامجهم على الحاسوب وهذا غير ممكن للاسباب التالية : 1- بسبب طبيعة علوم الحياة الخاصة بالتفاعلية مع البيئة سواء الخارجية او الداخلية 2- تعامل علوم الحياة مع التأريخ الحيوي للخلايا 3- لكون الكثير من مجالات علوم الحياة تعتبر غير مكتشفة ولا تزال دراساتها في المهد.


كما ان المعلوماتية الحيوية هو حقل يضم اكثر من مجال، ولكل مجال مختصوه ، فالعاملين في مجال البرمجة يحتاجون الى أسس في علوم الحياة ليكونوا على بينة عند وضع البرامج.
اما العاملين في مجال علوم الحياة فلابد ان يكونوا على اطلاع بسيط على مايلي :
1- لغات البرمجة التي تكتب بها البرامج 2-عمليات تحديد تواليات الجينومات والبروتينات
Sequence alignment 3-عمليات صف التواليات
4-أسس عمل كل برنامج، 5-الإلمام بالنواحي الفيزياوية والكيماوية ،
ومثال على ذلك في مجال علوم الحياة. باختصاص التقنيات الحيوية المستعملة في
إنتاج مضاد حيوي ما، فالمختص في مجال الأحياء المجهرية ليس بالضرورة ان يكون ملماً
بشكل كبير بالهندسة الكيماوية وبناء المخمرات ولكن لابد من ان يكون عنده معرفة ولو عامة عن بقية العلوم ذات العلاقة مع المعلوماتية الحيوية


وسائل المعلوماتية الحيوية
ان المعلوماتية الحيوية لكي تعطي نتائج حيوية ودقيقة لابد من توفر وسائل خاصة لاتمام ذلك ومن هذه الوساءل
1- الاعتماد على البحوث الحديثة في علوم الحياة 2- الاعتماد على تقنيات المعلوماتية في ظل عصر ثورة المعلومات، 3-التخطيط الدقيق الذي يوضع
مسبقاً لغرض توحيد ووضع المقاييس لتقييم العمل التجريبي. 4- تبني الأسس للحاسوب
للمساعدة في العمل لان هذه المتطلبات هي تقنيات Software والبرامج Hardware منها
البحث او لوازم البحث المستعملة لأداء عدة أغراض منها عمليات الكشف او القياس او
السيطرة او غيرها من الأغراض التي تهدف إليها البحوث.

محاور المعلوماتية الحيوية

تتلخص محاور المعلوماتية الحيوية في ثلاث محاور رئيسة:
المحور الأول: ويتظمن 1-تنظيم البيانات بطريقة تسمح وتمكن الباحثون من الوصول اليها مع إمكانية ·
التحديث والإضافة عليها. 2-تهيئة البيانات من المهام الأساسية، 3- خزن المعلومات
في قواعد بيانات وتحليلها.
المحور الثاني: ويتضمن1- تحديد وتطوير الأدوات المستخدمة من حاسوب وبرمجة 2- تحديد المصادر التي تساعد في تحليل البيانات. فمثلا عند مقارنة
توالي بروتين معين مع بروتين آخر .
المحور الثالث: ويشمل 1- استخدام الأدوات لتحليل البيانات 2- تفسير النتائج الخاصة بالجوانب البايولوجية ·
وبأسلوب واضح ومفهوم

مهام المعلوماتية الحيوية

المهام المنوطة بالمعلوماتية الحيوية كثيرة ومختلفة وهذا ادى الى :
1- تعدد طرق أدائها وبرامجها
2- تعدد طرق خزن المعلومات الذي يتمثل بقواعد البيانات الموضوعة
أصلا او التي يستلزم إنشاءها لإغراض معينة.
ومن هذه المهام:
تقوم بهذه المهامة بعض برامج الحاسوب التي تعمل على: 1- جمع Assembly اولا- عمليات التجميع
Shotgun الناتجة من عمليات تحديد توالي الجينومات بطريقة التشظية Reads القراءات
، 2- تدقيق هذه القراءات وحذف sequencing
المتكرر منها للوصول الى التوالي المقبول.
والموجودة بالبروتينات وهذه تمثل في العادة تواليات غير مشفرة وانما تقع ضمن عناصر Motifs 3- إيجاد الاجزاء المكونة للجزيئات الكبيرة مثل
التنظيم للجينات والتعريف بها يكون مهما من ناحية تحديد وظائف الجينات اذ ترتبط ببعض
البروتينات المنفذة للوظائف مثل عوامل الاستنساخ.


4-صف التواليات الحيوية
وتقع هذه المهمة في مجال دراسات الجينومات او دراسة البروتينات المقارنة وتؤدي
أكثر من وظيفة

.
وهي عملية اضافة معلومات تعريفية للتوالي:Annotation 5-عمليات التهميش والتوضيح
، اذ ان تحديد التوالي لوحده لا يزود بأي معرفة ما لم يلحق به
بعض التعليق والتهميش مثل: 1- نوعية التوالي تحت الدراسة 2-مكان وجوده 3-الأحياء التي تحوي
عليه وغيرها من المعلومات.
وهي مهمة جدا لفهم العلاقات الوراثية والتطورية بين :Phylogeny 6-إيجاد العلاقات التطورية
الأحياء ، اذ تساعد المعلوماتية في إيجاد : ا- الأبعاد الزمنية لتطور الأحياء بواسطة الرسوم او
ب- إيجاد المساقات وغيرها من الوسائل المستخدمة.
7-تحليل وإيجاد الجين: حيث تقوم المعلوماتية الحيوية هنا بما يلي : أ-إيجاد التوالي للجين المطلوب او تحت الدراسة
ب- تحديد فيما اذا كان هذا الجين كاملا او قطعة من الجين، ج-كذلك إمكانية تحديد
موقع الجين على الكروموسوم . د -إمكانية تحديد اجزاء داخل الجين مثل الممهد او المعزز" او
.DNA غيره من التراكيب بالاعتماد على توالي

او البروتينات وأصنافها. RNA او DNA 8- التنبؤ بتراكيب العناصر: وهذه تشمل الوظائف التالية أ- التنبؤ بتراكيب
ب- تتضمن هذه المهامة تحديد مواقع القطع في تواليات الحوامض النووية للعديد من الأغراض
, ج - البحث عن وجود المكررات والمناطق .Restriction maps أبسطها أنشاء خرائط التقييد
غير المشفرة.
د- تتضمن ايضا إيجاد بعض التراكيب الخاصة مثل أطر القراءة المفتوحة
المختلفة او DNAs 9- إجراء التحليلات للمواد الحيوية: وتشمل: أ- البحث عن التواليات المتشابهة بين جزيئات ال
او بروتينات. ب- البحث عن الحوامض النووية مقابل البروتينات التي تنتجها، اي تحليل RNAs
قبل الترجمة. DNA تواليات


وتعد من المهام الضرورية في الوقت الحاضر، اذ توفر : Primer design 10- تصميم البوادئ
بطرق DNA وسائل المعلوماتية الحيوية مجالا واسعا لتحديد البوادئ لإجراء عمليات تضاعف ال
مثلا. PCR
11-التنبؤ بالتراكيب الثانوية والثلاثية ومواقع الجزيئات الحيوية: وتتضمن أ- تحديد التراكيب الثانوية والثلاثية
لبعض الجزيئات الحيوية مثل البروتينات او الحوامض النووية تعد أساساً لتحديد وظائفها،
ب- إيجاد مواقع هذه التراكيب في الخلية وبالتالي معرفة وظائفها.
.

وتشمل : Retrieval of data 12- استرداد او استرجاع البيانات

أ عملية الدخول الى البيانات المخزونة في قواعد البيانات , ب- استرجاع هذه البيانات
لإغراض شتى، مثل : 1- استرجاع التواليات 2- التعرف على التواليات 3- تحديد موقع التواليات في الجين
4- تحديد وظيفة هذه التواليات 5- وضع التهميش المهم و الخاص للتواليات.
13- مهام تتعلق بالنواحي الفيزياوية: وتشمل : أ- إيجاد التراكيب الجزييئة
ب- التنبؤ بالطاقة اللازمة لعمليات الفسيولوجية المتداخلة مع بعض ج- التوزيع الفيزيائي او المكاني للجزيئات
ه – تحديد إمكانية الارتباط بين الجزيئات والتي تستخدم في العادة لتصميم الأدوية

وتتضمن: أ- ايجاد قواعد خاصة Literature searching 14- البحث عن المراجع
In silico للعديد من المراجع المتعلقة بالجوانب الحيوية او الإحصائية او الدراسات الحاسوبية
.studies
15- مهام خاصة :Special tasks بالاضافة لما ذكر من المهام الرئيسة أعلاه هناك بعض المهام الخاصة مثل: أ- البحث عن
, ب- استبدال القواعد النتروجينية التي تحث الأمراض وغيرها SNPs تغايرات النيوكلوتيد المفرد
من المهام التي ستدرج في مواقعها.



أساسيات المعلوماتية الحيوية
تحدد هذه الأساسيات بثلاث مكونات ضرورية لعمل المعلوماتية الحيوية وهي : .
1- تهيئة قواعد بيانات تسمح بخزن وإدارة وإضافة وتجديد البيانات الحيوية. ·
2- تطوير الخوارزميات والبرامج والإحصاءات لتحديد العلاقات بين البيانات واتخاذ القرارات ·
الخاصة عند التعامل مع مجاميع كبيرة من البيانات.
3- تحليل وتفسير الأنواع المختلفة من البيانات الحيوية ·
والبروتينات بمختلف تراكيبها لغرض توظيفها RNA و DNA والتي تشمل في العادة تواليات
للتعريف بهذه التواليات مثل تحديد نسق التعابير الجينية وغيرها من الأغراض.

.

الدوريات والنشرات الخاصة بالمعلوماتية الحيوية

نظرا لأهمية حقل المعلوماتية الحيوية فقد تخصصت بعض الدوريات او المجلات بالاهتمام
بالموضوع ونشر كل ما يتعلق به ، فضلا عن ان المجلات العادية الأخرى تظهر أهمية
المعلوماتية الحيوية في البحوث الخاصة بها وخاصة المجلات التي تعنى بالدراسات الجزيئية.
وقد صدرت عشرات وربما أكثر من الكتب التي تتناول جوانب المعلوماتية الحيوية المختلفة

Programs البرامج

يتم تنفيذ وظائف المعلوماتية الحيوية بواسطة برامج الحاسوب، لذا تعتبر البرامج أحد الوسائل التي يتم
بواسطتها تنفيذ وظيفة معينة للحصول على نتائج مصنفة بعد إدخال البيانات المراد معالجتها .
الذي PSORT وتسمية البرامج في الغالب تدل على المهامة التي تقوم بها مثل: 1- برنامج
TMHMM يتعامل مع البروتينات وتوزعها في المناطق المختلفة من الخلية، 2- برنامج
الذي يبحث ويساعد (Transmembranous Hidden Markov Model)
في معالجة البروتينات التي تكون مرتبطة او مستعرضة الأغشية ، وفي العادة تشير إيقونات
رمز البرنامج الى ما يدل عليه.
.


و يلاحظ ان البرنامج سواء في المعلوماتية الحيوية او غيرها من برامج وأنظمة الحاسوب
تستعمل الكتابة الصورية او الرمزية . وتظهر في تسمية الملفات ما يشير الى نوع الملف مثل :-
عندما يكون البرنامج ناتجا xl او Word للملفات النصية المعالجة بنظام 2- برنامج doc 1- ظهور
الأكسل . ويفضل غير المتمرسين باستعمال الحاسوب والتنقل بين البرامج Excel من برنامج
متعددة الأغراض، وتمثل هذه المجموعة Software والواجهات الى استعمال برنامج او وسائل
القطاع الأكبر من المستفيدين من المعلوماتية الحيوية وهم العاملين في مجال علوم الحياة ويكونون
بمثابة المستخدم الأخير للبرنامج

هي الأكثر استعمالا وفائدة للعاملين في مجال علوم Spreadsheet software ويعتبر برنامج
الحياة للاسباب التالية : 1- لانها توفر إمكانية إجراء العمليات الإحصائية،2- لها وسائل لفرز وترتيب البيانات
ومن الأمثلة عليها : 3- توفيرها للرسوم والمخططات
برامج نظام الإكسل الذي يستعمل لاغراض : 1- حساب مؤشرات حركيات الإنزيمات،2- تلوين الحوامض
في Domains الامينية بألوان محددة 3- كذلك يدخل ضمن برامج التنبؤ بتركيب الدومينات
البروتينات وغيرها من الأغراض.
.

وقت تنفيذ البرنامج

يختلف وقت أداء البرنامج لوظيفة محددة فقد تكون: 1- سريعة التنفيذ ثولني او دقائق 2- بطيئة التنفيذ ويأخذ
وقت طويل قد تصل الى ساعات او بعض الأحيان أيام وذلك اعتمادا على : 1- نوعية البرنامج
2- نوع الوظيفة التي يقوم بها البرنامج ،
ولتلافي البطؤ بالتنفيذ فقد تم تصميم البرامج الوسيطة لتعجيل سرعة الأداء. كما ان تنفيذ
بعض البرامج يكون غير ممكنا باستعمال الحواسيب العادية او الشخصية ويحتاج الى حواسيب
عملاقة وكفوءة


لغات البرمجة في المعلوماتية الحيوية
يوجد العديد من لغات البرمجة وهي في تطور مستمر اذ يظهر البعض ويختفي البعض الآخر،
يتم ادخال المعلومات الى الحاسوب بشكل اساسيات تسمى الخوارزميات وهي الاساسيات التي يقوم بواسطتها الحاسوب لأداء وظيفة محددة
لإعطاء النتائج ، وهذه الخوارزميات تزود للحاسبة بلغة برمجة والحاسبة تقوم بتفسير البرنامج
المكتوب بلغة محددة لإعطاء نتائج علمية واضحة ومبسطة ومفهومة .

هناك العديد من لغات برمجة الحاسوب لكتابة البرامج ولكن أكثر هذه اللغات استعمالات في
، C++ ، C# ، C , 2- لغة سي وتكون بانواع هي (Structured query language) SQL مجال علوم الحياة هي: 1- التسلسل التركيبي
وغيرها. Java ، 5- Perl 4- ،Phyton,3-

التعامل مع البرامج

عملية التعامل بين المعلوماتية الحيوية والحاسوب تحتاج عنصرين 1- المدخلات (مايتم ادخاله من السؤال او الهدف الذي يريده الباحث 2- المخرجات (وهي مايقوم به الحاسوب باخراجه كنتيجة لما طلبه الباحث)
والمدخلات يجب ادخالها اولا للحاسوب وهذه يجب ان تكون وفق الطريقة التي كتب
بها البرنامج فبعض البرامج لا تقبل مدخلات الا اذا كتبت بصيغة محددة وأكثر الصيغ المقبولة
للتواليات FASTA في معظم البرامج هي: 1- صيغة
3 - برامج اخرى تحتاج الى أرقام التسجيل ، GenBank 2- صيغ قاعدة بنك الجينات
للتواليات لتقوم هي بالمعالجة. Accession numbers

اما المخرجات فهي ايضا تكون مختلفة وفق البرنامج المستعمل، فالبعض منها تكون: نصية اي بشكل نص مكتوب بالتفصيل
1- او بشكل القيم الإحصائية ليكون المستخدم على دراية كاملة لقبول او رفض النتائج.


كيفية التعامل مع البرامج
التعامل مع البرامج يكون وفق الشروط التالية
1- قد لا يكون مباشرا وقد يحتاج المستخدم الى عملية التسجيل في
الموقع الذي يروم استخدام أحد برامجه ، 2- النتائج قد لا يتم الحصول عليها مباشرة
وإنما تحتاج الى إضافة الاسم وكلمة مرور او العنوان الالكتروني للمستخدم كي يتم Online
إرسال النتائج له بعد معالجتها بالبرنامج. 3- بعض البرامج يمكن تحميلها من
شبكة الانترنيت بشكل كامل من ملفات رئيسة وأخرى إضافية ليتمكن الباحث من استخدامها
ولكن في العادة تكون مثل هذه ، Offline programs بشكل مستقل وقت ما يشاء وهذه هي

.

DNA 4- بعض البرامج قد تكون مخصصة للتعامل مع تواليات

فلا يمكن ان تقبل تواليات حوامض امينية ، لذلك لابد من استعمال
ثم استعمال الأخيرة . DNA برنامج آخر ليقوم بعملية تحويل البروتينات الى صيغ تواليات لل
لقاعدة ID 5- بعض البرامج لا يمكن ان تقبل توالي محدد وإنما تتعامل مع أرقام التعريف
معينة لذلك لابد من البحث عن تعريف التوالي في قاعدة محددة لغرض استعمالها في البرنامج

طريقة البحث عن الهدف المطلوب

من الخيارات المستعملة في البرنامج عند البحث مثلا عن نواتج ترجمة توالي حوامض
نووية الى بروتينات يجب اتباع مايلي : 1- تخصيص نوع الكائن الحي هل هو في مجموعة خلايا حقيقية النواة
او بدائية النواة والتي تقسم بدورها الى بكتريا موجبة لصبغة كرام او سالبة للصبغة او هي من
مجموعة الاركيا وذلك لاختلاف الأحياء في تفضيل استخدامها للشفرات الوراثية لإنتاج
الحوامض الامينية وغيرها من الاختلافات.
كأن Queries 2- تحديد نوع الاستعلامات
تجمع المعلومات التي لها صفات مشتركة لتستعمل كمدخل لبعض المهام. 3- وجود
المستعملة مثل Keywords وهذه تحدد بالكلمات المفتاحية (Filter) نظام التصفية او الترشيح
او Species رقم التسجيل الذي يعد أفضل صفة انتخابية للمدخل المطلوب، او استعمال النوع
غيرها من المعلومات.


مخرجات البرامج
من اهم المخرجات اللازمة بعد إنشاء البرامج مايلي : 1-القيم الإحصائية وهي مهمة لانها تمكن المستخدم
من ترجيح مخرجات البرنامج بعد التنفيذ.

2- تمثيل النتائج بشكل صور واضحة ومبسطة فتكون

أفضل ومرغوبة أكثر لانها تعطي ملخص واضح.

3- تمثيل النتائج من خلال الأشكال المختلفة والألوان للتوضيح، كما ان بعض البرامج
يمكن ان تستعمل أكثر من وسيلة لتمثيل النتائج.


اصطفاف التواليات ( التسلسلات البايولوجية مثل تسلسل الحامض النووي او البروتينات)

الشكل التالي يوضح إحدى طرق توضيح اصطفاف التواليات
اصطفاف التواليات .Sequence alignment
وهي عملية صف متوالية معينة لحامض نوي اما (د ان اي ) او (ار ان اي ) او بروتينات ومقارنتها مع متوالية اخرى تصف امامها لمعرفة
درجة التشابه بينهما.
اي ان الهدف من المقارنة هو تشخيص مكان التشابه وقد يكون التشابه : 1- بالوظيفة , 2- بالتركيب , 3- بالتطور. مثال:لديك التواليتان التاليتان , جد درجة التشايه بينهما
Seq-1 CTGATACGCCTAT
Seq-2 CTATTCGCGGTAT
الان كيف نعمل اصطفاف لها: كما يلي
على الحاسوب:نقوم بدفع التسلسل وخلق فجوة اما في التسلسل الاول او الثاني الى ان نحصل على سلسلتين متطابقتين وكما يلي:
Seq-1 CTGATACGCC ..TAT
Seq-2 CT .TTCGCGGTTAT
هنا كل فجوة تمثل طفرة اي ان الفجوة كانها قد حصل مكانها طفرة افتراضية وليس حقيقية: اذن هنا عندنا ثلاث حالات:1- يوجد تطابق 2- لايوجد تطابق 3- يوجد طفرة (قد تكون 1 او 2 او اكثر)


انواع الاصطفاف:
1- الاصطفاف المزدوج 2- الاصطفاف الموضعي 3- الاصطفاف العام

الخوارزميات التي تستخدم بالاصطفاف:1

- الخوارزمية النقطية 2- الخوارزمية الديناميكية 3- الخوارزمية الارشادية

تسلسل جزء من جين لبكتريا

تسلسل جزء من جين لفايروس
A
C
G
T
T
A
C
G
G
A


T

X
X


G

X

X
X


G

X

X
X



C
X

X


T

X
X


G

X

X
X


C
X


X


T

X
X


A

X

X
مثال على الاصطفاف النقطي وضح من خلال المصفوفة التالية ذات التوالي الجيني, هل الكائنين متشابهين وراثيا وهل يعودان انفس الاصل؟
يتم الوصل بين النقاط المتسلسلة بشكل قطري فاذا حصلنا على امتداد قطري بينهما على طول المصفوفة فهذا يعني انهما يعودان لنفس المصدر وقد تطورا من اصل واحد , واذا لم يتم الحصول على خط قطري واحد وحصلنا على عدة خطوط فيعني انهما متباعدان, وهنا متباعدان بسبب الحصول على عدة خطوط قطرية وليس خطا قطريا واحدا

ويمكن ان تكون النتائج بشكل رسم اذ يمكن ان تمثل عمليات الاصطفاف بخطوط ·
: قطرية بين تواليين ثم رسم المحصلة كما موضح في الشكل
شكل 3.2 : إحدى طرق توضيح اصطفاف التواليات لبروتينين وهنا خط افقي مركزي واحد اذن يعودان لمصدر واحد


وتستعمل الرسوم في تمثيل مكان وجود البروتينات ، الشكل ( 4.2 ) يمثل أحد البروتينات الذائبة
التي ليست لها علاقة بالأغشية، اما الشكل ( 5.2 ) فتوضح وضعية البروتينات في الغشاء
واستعراضها لكامل الغشاء مع توضيح القيم الإحصائية لترجيح هذه النتائج، في حين ان
البروتين نفسه وعلاقته بالأغشية يمكن ان يمثل بصيغ نصية عند استعمال برنامج آخر الذي
تظهر فيه احتماليات التنبؤ بالبروتين .
شكل : يوضح احد البروتينات غير الغشائية(الذائبة)

شكل 5.2 : رسم توضيحي لأحد البروتينات المستعرضة للأغشية

استعمال الألوان

يعد استعمال الألوان من الوسائل المفضلة لأنها تعطي معلومات أكثر تميزا ووضوحا
واختيار الألوان يجب ان يتم بعناية اذ انه يزيد من التأكيد على نقاط محددة للفهم . ولعمليات
, Matlab , 2- Excel : التلوين توجد برامج عدة تحوي ضمنا وسائل للتلوين مثل :1-
, 4- برامج التحوير التجميلي لان في بعض الأحيان تحتاج عمليات التلوين الى تحويرات تجميلية قبل ، Mathematica3-
مثل Vector graphics عمليات النشر والطبع وهناك برامج يمكن ان تقوم بهذه المهامة منها : 1-
, 2- برامج التمثيل الرياضي للخطوط والنقاط PostScript و PDF
والمنحنيات وغيرها، :

5- برنامج معالجات الصور والألوان مثل

فتعتمد قيم مصفوفات اللون GIF و JPG لصور Raster graphics نظام
والعمليات الثانوية مثل تصغير وتكبير الصورة .Pixels التي تسمى Colormatrix values

كما BLAST 6- هناك برامج مهمة تستعمل صيغة الرسوم والصيغة النصية معا مثل برنامج
موضح في الشكل التالي ويمكن توضيح اي منطقة من التأشير عليها


يلاحظ الاختلافات البسيطة بين تواليات البروتينات التاليةBLAST أ : صيغة نصية لبرنامج
s وفي الثالث الاختلاف ب H بينما في التوالي الاخر الاختلاف فقط ب I & F في التوالي الاول يوجد اختلاف فقط في حامضين امينيين هما

BLAST : صيغة مصورة لبرنامج

BLAST شكل : الصيغ المختلفة لبرنامج
هنا برنامج بلاست يعطى التطابق بين التوالي على اساس اللون فيلاحظ ان الاحمر يعطي تطابق كبير اكثر من 200 نقطة وهذا يعتمد بينما اللون البنفسجي يعطي تطابق اقل وهكذا الى اللون الاسود الذي يعني لايوجد تطابق

WebLogo ومن البرامج المتخصصة بالصور هو برنامج الشعار الصوري ·
والبرنامج يستعمل لعمليات اصطفاف التواليات المتعددة (التي ، Logo او يختصر الى
تكون متساوية الأطوال) ليعطي الكثير من المعلومات مثل : 1- توفير سجل واضح وأكثر دقة
من الطرق الأخرى لتمثيل تشابه التواليات. 2- يستعمل لصف تواليات الحوامض النووية
وكذلك البروتينات 3- يوفر ميزات لعمليات الاصطفاف التي تكون من الصعوبة إدراكها،
4- تحديد أعظم ثبوت للتوالي مثل القواعد النايتروجينية
.

الكوانين: برتقالي ، الثايمين واليوراسيل: احمر ،السايتوزين: ازرق ، الأدنين: اخضر
اما ألوان الحوامض الامينية فتعطي الألوان اعتمادا على صفاتها الكيماوية ومنها:
(N, Q, C,Y, T, S, G) الحوامض الامينية القطبية تكون بلون اخضر وهي ·
H, R, K الحوامض الامينية القاعدية وتكون بلون ازرق وتشمل ·
E, D الحوامض الامينية الحامضية وتكون بلون احمر وتشمل ·
W, P, I, L, الحوامض الامينية الكارهة للماء وتكون بلون اسود وتشمل عدد كبير ·
V, A, M, F
وللمستخدم ان يغير من الألوان او يستعمل الأبيض والأسود


أطالس الجينومات
ومن الوسائل المصورة ذات الفائدة الكبيرة هو استعمال أطالس الجينومات
وسيلة مفيدة لعرض كم كبير من المعلومات Genome atlas أطالس الجينومات
الحلقية مثل: 1- كروموسومات بدائية النواة وبلازميداتها DNA الخاصة بعناصر
2- تميز الألوان وتدرجها وعادة تظهر الأطالس مع مرفق بتدرج الألوان والقيم الإحصائية،
Intrinsic curvature الذاتية او الداخلية DNA 3- تقوس أشرطة
مع القيم الإحصائية Stacking energy 4- اظهار القيم الإحصائية لها وكذلك طاقة الرص او التنضيد
وفيما اذا كانت معرفة ومهمشة ام لا، وكذلك , 6- تذكر CDS 5- توضيح المناطق المشفرة
GC skew المكررات في الجينوم , 7- انحراف المحتوى من قواعد السايتوزين والكوانين

λ المختلفة توضح عدد من تواليات العاثي Logo شكل : مخرجات برنامج الشعار

هنا في برنامج لوكو يوضح نسبة القواعد النتروجينية في عدة تواليات للفايروس نوع لامبدا, وفي الاسفل يعطي مقدار تردد كل قاعدة التوالي وموقعها من التوالي

شكل 8.2 : أطلس لجينوم احد البلازميدات يعطي عدد القواعد النايتروجينية نوع ثايمين وادنين

خزن النتائج

يكون الخزن ضروريا لكي نقوم بالوظائف التالية : 1- اعادة استدعاء المعلومات مرة اخرى مستقبلا : 1القيام بعملية الأرشفة 3- التعديل او حتى لإنشاء قواعد بيانات جديدة, 4- اختيار صيغ الخزن المستعملة والتي تعتمد على البرنامج المستعمل، فبعض مالكي البرامج يقدمون صيغ غير شائعة (صيغ خاصة) بدلا من الصيغ القياسية او العامة او ملفات مفتوحة للاستعمال.

ومثل هذه البرامج الخاصة بالمالك يمكن ان يؤدي الى مشاكل عديدة اهمها الاعتماد على برنامج معين
للوصول الى البيانات مما يصعب هذه المهامة وكذلك يصعب استرجاع البيانات وتتعقد العملية
اكثر عند الحاجة الى ربط اكثر من برنامج حاسوب مختلف.


ولذلك فان تحديد صيغ الملفات ضمن الشائع منها له فائدة كبيرة اذ يشجع بيع وانتشار البرامج ذات الأداء الجيد ، وعلى
العموم يكون القرار لمالك البرنامج ويكون خاص بكل حالة.

5- إجراء إضافة بيانات الى قواعد البيانات وبمجرد إيجاد الجدول ، المراد الإضافة عليه يمكن إدخال البيانات الجديدة وربما حذف غير المطلوب من القاعدة

التعاون العالمي والتقني في وضع البرامج وقواعد المعلومات
نظرا لضخامة حجم البيانات الحيوية وكثرة البرامج الموضوعة لمعالجتها حصل اضطراب في
بعض المعلومات لذا تم التفكير في إجراء عمليات التوحيد للمصطلحات والمسميات والتي تشمل : 1-توحيد
الموحدة (General file format) GFF , 2- استعمال صيغ Gene ontology تسمية الجينات
وتشمل بعض الجوانب مثل: Metadata 3- استخدام البيانات الإضافية
وغيرها من AT أ- استخدام اسم الكائن المشتقة منه التواليات قيد الدراسة ،ب - استخدام طول الجينوم محتواه من
المعلومات الإضافية ، اضافة الى وجود البيانات الأصلية لان البيانات الإضافية ضرورية للحفاظ على صلب الموضوع الخاص بالبيانات الأصلية
يمكن AAAA لذلك فان الاعتماد على البيانات الاصلية فقط واهمال البيانات الإضافية يؤدي الى التباس بالمعلومات فمثلا التوالي
ان يعني الاحتمالات التالية : 1- انه توالي الحامض الاميني الالنين في سلسلة بروتين , 2- انه يعني توالي الأدنين في
DNA لذلك فان وضع معلومة إضافية تشير الى ان التوالي قيد الدراسة هو DNA تواليات
IUPAC المكررة تعني الأدنين، وفي هذا المجال لابد من الرجوع الى قواعد "A" سيتضح ان
)International Union of Pure and Applied Chemistry الخاصة بالرموز المستعملة (

صيغ الملفات المستعملة في المعلوماتية الحيوية

تحتاج صيغ الملفات المستعملة الى تحوير سواء في المعلومات المدخلة او المخرجات بعد
إجراء عمليات المعالجة عليها بالبرامج ، لذلك وجدت برامج تحول صيغ الملفات بحيث تلاؤم
استخدام بعض البرامج.
Plaintext الذي يكتب بصيغة النص العادي Flat file وأكثر الملفات شيوعا هو الملف العادي
وتكون بصيغة قياسية محددة. اذ يتمثل الأخير بوجود صفات مشتركة تستعمل فيها الحروف
وهذا ، Keyboard والأعداد والتنقيط الموجودة على إحدى وسائل الإدخال الى الحاسبة وهي
لا يستعمل في كثير من الأحيان في المهام الخاصة بالمعلوماتية الحيوية وان كان يستعمل في
بعض الأحيان في وضع قواعد البيانات. وتختلف النصوص العادية عن النصوص ذات الصيغ
.HTML وأفضل الأمثلة عليها Formatted texts المختلفة



وأفضل الأمثلة عليها Formatted texts المختلفة
الخاص Notepad والملفات العامة يمكن ان تكتب بعدة طرق وهي : 1- تكتب بالنص العادي , 2- يمكن ان تكتب بعدد من البرامج مثل
في نظام vi , 4- او تكتب ببرنامج Mac في نظام ماكنتوش TextEdit , 3- او تكتب ببرنامج Windows ببرنامج نوافذ
الذي يتم التعامل معه وهذا ما يحصل مع نظام التشغيل نوافذ Plain sequence وقد تكون الصيغ خاصة بالتواليات فقط ومنها صيغة التوالي العادية
وتحوي فقط تواليات للحوامض النووية او تواليات الحوامض الامينية بشفرة الحرف format
: الواحد كما موضحة في الشكل التالي 10.2

لتوالي ما Plain sequence شكل 10.2 :صيغة عادية

وتكون هذه الصيغ بدون اي معلومات

)

FASTA صيغة

التي تستعمل بشكل خاص مع FASTA ومن الصيغ المهمة في المعلوماتية الحيوية هي صيغة
او البروتينات وتستعمل في العديد من برامج التنفيذ. ويمكن للملف ان يحوي DNA تواليات
وكتابة النص فيه تكون كما يلي : .Multi-FASTA توالي واحد او عدة تواليات منفصلة وعندها يسمى
وهي علامة اكبر من (<) , 2- يليها FASTA 1- يحوي السطر الأول على بداية (تميز صيغ
سطر او سطرين للتعريف بالتوالي (وهذه تكون بمثابة بيانات إضافية المذكورة في موقع آخر)
3- يلي ذلك ذكر توالي الجزيئات المعنية سواء باستعمال الحروف الصغيرة او الكبيرة على ان
تكون بشكل متواصل بدون فواصل او تنقيط وتستمر بشكل متواصل وعندما تكون طويلة تقسم
الى عدة اسطر، وفي هذا النوع من التواليات يشار الى الحوامض الامينية بشفرة الحرف
الواحد. ولذا فمن الملاحظ ان هذه الصيغة لا تعطي معلومات وافية عن التوالي المتعامل معه،
وتفيد لبعض الأغراض غير استخلاص المعلومات الوافية.

.


وفي بعض الأحيان يتم الحصول على ملفات مضغوطة والتي يشار اليها في نهاية اسم الملف
او اي إشارة مشابهة ولغرض تحويل هذه الملفات الى شكل قابل tgz ، tar ، gz ، zip ب
او PKZIP او WinZip للقراءة والاستعمال يمكن فك الضغط (او الاستخلاص) ببرامج مثل
غيرها من البرامج المتوفرة. ولكن في العموم يمكن الحصول على ملفات عادية دون الحاجة
الى معالجتها ويمكن استعمالها مباشرة

تحويل صيغ التواليات

تحتاج بعض البرامج ان تكون المدخلات بصيغ محددة مثل : 1- البرامج التنفيذية للتوالي حيث تحتاج
EMBL format , 2- برامج أخرى تحتاج التوالي ب FASTA التوالي ان يكون بصيغة
, 4- البرامج التي يمكن ان تحول Readseq 3- برنامج قراءة التوالي مثل
اي صيغة للتوالي الى الصيغة المطلوبة وذلك بوجود الخيارات المرفقة في البرنامج.
الى تواليات DNA 5- برامج تحويل التواليات من تواليات لل
بروتين او بالعكس.


وتحتاج برامج تحويل تواليات ال د ن أ الى تواليات بروتين برامج خاصة تلحق بها
بعض الخيارات مثل: 1- تحديد التوالي المراد تحويله, هل هو : 1- أحياء حقيقية النواة , 2- هل هو بدائية النواة
هل هو: أ- نوع اركيا , ب هل هو نوع بكتريا موجبة لصبغة كرام او سالبة لصبغة كرام

ولذلك تربط بعض هذه البرامج الخاصة بجداول تفضيل استعمال الشفرات الخاصة
بالكائنات الحية مثل : 1- قاعدة البروتينات السويسرية
) Expert Protein Analysis System) ExPASy وخاصة SWISSPROT


مراكز المعلوماتية الحيوية
هناك العديد من المراكز التي تعنى بالمعلوماتية الحيوية وتقدم خدمات كثيرة عبر شبكة
الانترنيت، وتتوزع المراكز على أنحاء مختلفة من العالم. وتختلف المراكز من حيث سعة
شموليتها لمتطلبات المعلوماتية الحيوية وإمكانياتها ولعل أهمها مايلي :
.(National Center for Biotechnology Information) NCBI1-
البريطاني (European Bioinformatics Institute) EBI2-
في (European Molecular Biology Laboratory) EMBL 3- الموقع
ألمانيا/الدول الأوربية
في اليابان . (DNA Database of Japan) DDBJ4-
.

وهومهم جدا وله المميزات التالية : NCBI وكل من هذه المراكز متواصلة مع بعضها على مدار الساعة، وأهمها
1- يعتبر احد المنظومات الحكومية التي تعنى بالشؤون الطبية، 2- يتحوي على إمكانات هائلة تنطوي تحتها
المعلوماتية الحيوية، 3- يضم عدد من قواعد وبنوك البيانات , 4- يضم وسائل تنفيذ البرامج والروابط مع
المواقع خارج نطاقه.

ويليه في الأهمية المركز الأوربي البريطاني ويمتاز ب : 1- انه يمتلك إمكانيات كبيرة
تساهم في دراسات المعلوماتية الحيوية، 2- يوفر تسهيلات عالية في ادخال المعلومات واخراجها باشكال سهلة الفهم

ثم يليهم بالأهمية المركز الياباني.

اضافة الى وجود العديد من المراكز الأخرى الخاصة ببعض البلدان او الجامعات المشهورة التي تقدم
الوسائل والإمكانيات المستخدمة في مجال المعلوماتية الحيوية ولكنها تكون على مدى ضيق
مقارنة بما مذكور أعلاه


EMBL site الموقع الالماني

وهو متخصص على الاغلب بالجينات حيث يوفر العديد من الجينات EMBL ; التعامل مع موقع
البكترية ولكل مركز درجته من المصداقية، ولكن التفضيل ليس هو الحد الفيصل في مجال
استخدام .
(Center for Biological Sequence CBS 5- المركز الدانمركي أنشأ عام 1993 وهو
وله عدة مميزات مثل : 1- انه يقوم بعدة أبحاث في مجال علوم الحياة المتعلقة بالمعلوماتية الحيوية. Analysis)
2- ويوفر المركز الكم الكبير من البرامج اللازمة في دراسات المعلوماتية الحيوية ,3- اغلب برامجه
بسيطة سهلة الاستخدام ومخرجاتها سهلة التفسير وتشمل كل النواحي التي يحتاجها المستخدمون
في مجال المعلوماتية الحيوية. 4- المركز مدعوم من قبل الجهات الرسمية في الدانمرك .

ومن الجدير بالذكر ان المواقع الالكترونية قد تكون عرضة للتقاعد والاختفاء لانها غير مدعومة ماديا
ولكن هناك بعض المراكز التي تكون مدعومة بمؤسسات رسمية وتكون ثابتة والموضح بعضها وعناوينها في الآتي

قواعد البيانات

تعتبر قواعد البيانات إحدى الركائز التي تعتمد عليها المعلوماتية الحيوية التي نشأت نتيجة لتفاقم
البيانات التي احتاجت الى ترتيب وخزن وإيجاد الوسائل الملائمة للوصول اليها ، فقواعد
البيانات أصبحت ضرورة للعاملين في مجال علوم الحياة وبمثابة وسيلة الاستخدام اليومي ،
Databases لذلك كانت عمليات التحديث المستمر ضرورية.
معنى قاعدة البيانات
هناك اكثر من معنى لقاعدة البيانات وكما يلي :
1- تعني تجميع مرتب للبيانات وهو المعنى الأكثر شيوعا في الاستعمال. ·
2- تعني برنامج حاسوب يستعمل للبحث في السجلات واسترجاع بعض المعلومات وبهذا ·
مثل Database management system (DBMS) المعنى تكون قاعدة البيانات ممثلة لل
وهنا هي تمثل البرنامج الذي يدير قاعدة البيانات وليس قاعدة بيانات. MySQL
3- وهو يستعمل بكثرة أيضا وهو وصف لمجموعة من الملفات مخزونة في ·
يحوي عدد من التواليات يعتبرها البعض قاعدة بيانات. Folder الحاسوب وموجودة في مطوي
.


أسباب ودواعي استخدام قواعد البيانات ومنها:
1- تحديد هوية التواليات الجديدة، وعند تحديد توالي جديد المطلوب معرفة فيما اذا كان
مسجل مسبقا سواء كليا او جزئيا لذلك يتم البحث عنه في قواعد البيانات وكذلك معرفة
فيما اذا كان التوالي الجديد موجود في أحياء أخرى.
غير المشفرة مثل DNA 2- البحث عن تواليات وامتدادات معينة خاصة من تواليات
المكررات او العناصر التنظيمية.
3-إيجاد وظائف الجينات او التواليات غير المعروفة بالمقارنة مع ما يقابلها من التواليات
الموثقة في قواعد البيانات.
لتواليات تحت الدراسة لأغراض التضخيم كما في Primers 4-البحث عن البوادئ
او لغيرها من الأغراض وذلك بإجراء دراسات مقارنة مع ما ، PCR استعمال تقنيات
مسجل في قواعد البيانات

تعريف قواعد البيانات

تعرف قواعد البيانات على انها عبارة عن جداول او أرشفة الكترونية تستخدم لخزن وتنظيم البيانات بطريقة
يمكن معها استرجاع المعلومات المطلوبة بسهولة باستخدام معايير بحث مختلفة.

تتألف قواعد البيانات من: 1- البرمجيات بكل انواعها , 2- الجزء الصلب للحاسب الالكتروني لغرض إدارة البيانات.

ان الهدف الرئيس من تطوير قواعد البيانات هو لتنظيم البيانات في مجموعة هيكلية وكما بالتسلسل التالي :
1- القيود التي تسمح باسترجاع المعلومات.
2- كل قيد يسمى ايضا مدخل ،
3- كل قيد يحوي عددا" من الحقول
4- كل حقل يحتوي على عدد من العناصر للبيانات الحقيقية،


على سبيل المثال حقول مثل الأسماء، أرقام الهاتف،
العناوين والتواريخ.

ولغرض استرجاع قيد معين من قواعد البيانات، فان المستخدم يمكن ان
لغرض إيجادها بصورة Value يخصص قطعة او جزء معين من المعلومات ، تسمى قيمة
خاصة في حقل معين فالحاسب الالكتروني يسترجع جميع قيود البيانات التي لها علاقة بقطعة
.Querying المعلومة المطلوبة. وتسمى هذه العملية بالاستعلام

ولغرض تسهيل الوصول واسترجاع البيانات، يتطلب ذلك برنامج معقد للحاسب الالكتروني
للتنظيم والبحث والوصول الى البيانات التي تم تطويرها وتدعى أنظمة إدارة قواعد البيانات
ان أنظمة إدارة قواعد البيانات يمكن
ان تصنف الى نوعين:
Relational database management 1- أنظمة إدارة قواعد البيانات العلاقية
. systems
Object –oriented database 2- أنظمة إدارة قواعد البيانات المواضيع-الموجه
.management systems
وبالتالي، فان ما ينتج من تنفيذ أنظمة قواعد البيانات هذه تعرف بقواعد البيانات العلاقية او
قواعد الموضوع-الموجه.

Relational databases قواعد البيانات العلاقية

تستخدم قواعد البيانات العلاقية مجموعة من الجداول بدلاً من استخدام جدول منفرد كما في
قاعدة البيانات ذات الملف العادي لتنظيم البيانات.


يدعى كل جدول "علاقة" ، يتكون من عدد من الأعمدة والصفوف. تشير الأعمدة الى الحقول المنفردة، في حين تمثل الصفوف قيم الحقول في القيود .
وهذا Attribute تفهرس الأعمدة في الجدول طبقا الى ميزة عامة تدعى بالصفة المميزة
يمكن الانتقال المتقاطع مع الجداول الأخرى.

ولغرض تنفيذ الاستعلام في قاعدة البيانات العلاقية
يختار النظام عناصر ربط البيانات من عدد من الجداول المختلفة ثم يوحد المعلومات
في تقرير واحد وبذا يمكن الحصول بسرعة اكبر على معلومات محددة من قواعد البيانات
العلاقية مقارنة مع قاعدة البيانات ذات الملف العادي.

الجامعة

الاسم
الرقم
الموصل
سعيد حامد محمد
1

الدرجة

رقم الطالب
89
1


الفصل الدراسي
رقم الطالب
حياتية
1

جدول 2.2 : جدول بيانات لقواعد البيانات العلاقية

( جدول ( 1) جدول ( 2) جدول 3(

Object-oriented databases قواعد بيانات الموضوع-الموجه

أحدى المشاكل التي تواجه قواعد البيانات العلاقية هي ان الجداول المستخدمة لا تصف
العلاقات الهرمية المعقدة بين مواد البيانات.

وللتغلب على هذه المشكلة، تم تطوير قواعد بيانات الموضوع الموجه بحيث يتم خزن البيانات كأشياء.

في لغة برمجة الشيء الموجه، يمكن النظر الى الشيء على أساس انه الوحدة التي تضم البيانات والبرامج الفرعية التي تعمل على البيانات.

C++ وتستخدم لغات البرمجة مثل

لإنشاء قواعد بيانات المواضيع الموجهة .

طبيعة البيانات المخزونة في القواعد

اغلب قواعد البيانات الخاصة بعلوم الحياة تحوي على بيانات أولية وهي اما تواليات لل
ولذا Metadata او البروتينات. ولذلك كانت هذه بحاجة الى بيانات إضافية RNA او DNA
وجب وضع استراتيجيات مهمة عند خزن المعلومات وأهمية التفريق بين
البيانات الأولية
والبيانات الإضافية .
اذن انواع البيانات هي
1-البيانات الاولية : هي اما تواليات حوامض نووية او تواليات بروتينات، ففي الحالة
ليعني N الأولى تكون البيانات بمثابة مكررات من 4 او 5 حروف او أكثر عند إضافة الرمز
لأي حامض غير X اي نيوكلوتيد. اما في حالة البروتينات فتكون مكونة من 21 حرف وجعل
معروف الهوية وبذا تكون مفردة البيانات الأصلية محددة .

2-البيانات الإضافية فهي :

بيانات غير محددة ، وقد تكون البيانات الإضافية هي الهدف المطلوب من البحث في قاعدة البيانات
دون الحاجة الى البيانات الأصلية ، مثلا يراد عمل تجميع لكل الأحياء المحبة للحرارة الموجودة
في القاعدة او معرفة الدرجات الحرارية التي تعيش فيها الأحياء المحبة للحرارة، فالمتوقع هنا
عدم الحاجة الى التواليات ومن غير المتوقع ان توجد هذه في الجزء الخاص بتواليات الجينوم.
ويمكن تقسيم البيانات الإضافية الى
1-البيانات الإضافية الأولية او البدائية
2-البيانات الإضافية المشتقة

البيانات الإضافية الأولية او البدائية والتي تسمى ايضا الحقائق الأولية وهي تمتاز بالمميزات التالية
1- ان لها علاقة بالتوالي نفسه , 2- تتضمن ذكر الكائن الذي اشتق منه التوالي
3- ذكر التوزيع الهندسي للجزيئة مثلا تكون حلقية او مفتوحة، 4- اعطاء معلومات عن تركيب
الكروموسوم او البلازميد او الفيروس وطرق تحديد تواليهم في المختبر، 5- احتواءها
على الصفات الفسلجية للكائن 6- احتوائها على الموقع الجغرافي الذي يوجد فيه 7- ذكر الأعراض
السريرية عند الإصابة في حالة الأحياء الممرضة وغيرها من المعلومات

.
يتم الحصول عليها من عمليات الحاسوب ،Derived اليدويmetadata البيانات الإضافية المشتقة ·
وهذه تأتي ، Manual annotation التي تجري على البيانات وتشمل : 1- التهميش
الذي يؤدي AT اما من التوالي او اي معلومات أولية أخرى فمثلا تحديد محتوى الجينوم من
ويكون بعض الأحيان من الصعوبة .GC بدوره كتحصيل حاصل الى معرفة المحتوى من
2- تحديد صنف البيانات الإضافية فيمكن ان تتحول البيانات من الصنف الأول الى الثاني.
التي تعد بيانات إضافية Genome atlases ومن أهم البيانات الإضافية هي أطالس الجينومات
للتواليات الأصلية ويكون الأطلس من البيانات المشتقة.


أهمية البيانات الإضافية
تكون البيانات الإضافية مهمة جدا في بعض الأحيان وبدونها يصبح من غير الممكن استخدام
التواليات للجزيئات الحيوية وذلك لعدة أسباب:
وهذا يسهل الوصول الى مجاميع Indexing 1- تكون البيانات الإضافية ضرورية لعملية الفهرسة ·
خاصة من المراجع المهتمة بتوالي معين.

2- كما يمكن باستعمال البيانات الإضافية الوصول الى تواليات محددة مثل البحث عن التواليات
بنسب محددة فان ذلك يسهل باستخدام البيانات الإضافية . AT الحاوية على

3-يمكن ان تساعد في معرفة أصل التوالي المستعلم عنه مثلا توالي مشتق من كروموسوم او ·
بلازميد، وكذلك يمكن تحديد الكائن او المجموعة التصنيفية التي ينتمي اليها. وتساعد في تحديد
البيئة التي أخذ منها الكائن.

.

ويمكن الاستنتاج ان البيانات الإضافية مهمة للاسباب التالية : 1- ستحسن او على الأقل تقلل من
اللبس الحاصل حول تفسير النتائج، ,2- تتضمن وصف للتقنيات المستعملة 3- التعريف بوحدات القياس المستعملة 4- وصف لظروف أخذ النماذج وطرق إجراء التجارب،

ولهذه الاسباب فان غياب البيانات الإضافية يمكن ان تجعل
البيانات المخزونة في قواعد البيانات بدون فائدة، لذا كان للبيانات الإضافية دورا" كبيرا" في
المعلوماتية الحيوية


تصنيف قواعد البانات
1- قواعد البيانات العامة للجزيئات الحيوية
وتمثل تواليات البروتينات (موجودة على الموقع الاوربي جنيف) وتواليات الاحماض النووية وتوجد على الموقع الاوربي EMBL
2- قواعد بيانات خاصة بالكاربوهيدارت ((Car Bank
3- قواعد البيانات الخاصة بالتركيب الثلاثي ( (3Dخاصة بتركيب جزيئات البروتينات مثل بنك بيانات البروتينات Protein Data Bank (PDB)
4- قواعد البيانات الخاصة بالجزيئات العملاقةDatabase Macromolecular structure
5- قواعد البيانات الخاصة بتركيب الاحماض النووية(NDB) Nucleic acid structure database
6- قواعد البيانات الخاصة: وهي خاصة باجزاء من الجزيئات العملاقة وهي تخدم جزء محدد من الباحثين

.
7- القواعد الخاصة بال DNAو ملحقاته (ESTs) sequence tags Expressedوتوجد في موقع NCBI وقاعدة البيانات الخاصة Sequence tagged sites و قواعد البيانات الخاصة بتغايرات مفردة من النيوكليوتايدات وكلها تعود لنفس الموقع اعلاه.
وقواعد البيانات الخاصة بالطفرات التي تحصل بالانسانmutation database (HGMB) Human gene
وقواعد بيانات الجينات الحاوية على المثيل لانواع مختلفة من السرطاناتMethylated genes
وقاعدة البيانات للانزيمات المثيلةDNA methyltransferases وهي تقع ضمن القاعدة العامة GenBank
هذا اضافة الى قواعد بيانات متعددة وكثيرة مثل قواعد بيانات لجينات الانسان والفئران والكروموسومات والخلايا الجنسية والتوائم المتماثلة ومرض الزهايمر والجينات الاساسية للحياة وقواعد بيانات لانواع الهستونات وقواعد بيانات الخاصةبالجينومGenomes online database وقاعد خاصة بالاحياء Organism specific database وقواعد بيانات جينوم الاحياء وغيرها كثير.

قواعد التصنيف

يعد تصنيف الأحياء أحد الجوانب المهمة في دراسات علوم الحياة، لذلك أخذ هذا الجانب
للاسباب التالية ،NCBI نصيبه من وضع قواعد البيانات. وأكثر المواقع اهتماما بعمليات التصنيف هو
1- انه يحوي على قاعدة بيانات للتصنيف ، 2- انه ويوفر شجرة للعلاقات التطورية بين الأحياء بالاعتماد
للوحدات الصغيرة للرايبوزوم. 3- يتم البحث في مجال التصنيف اعتمادا على الاسم RNA
ويكون استعمال Taxid (Taxonomy Identifier) العلمي للكائن او التعريف التصنيفي
يمكن ان يوصل الى Taxid الأخير هو الأفضل نظرا لإعادة تسمية الأحياء ، فاستعمال
: الأسماء الحديثة مع ذكر التسميات القديمة للأحياء وعملية البحث موضحة في الشكل 16.2


NCBI شكل 16.2 : واجهة الموقع الخاص بالتصنيف في

يمكن الوصول الى المعلومات عن اي كائن مثل البكتريا او الاركيا من استعمال الروابط
الجانبية، فللبكتريا تظهر قوائم التصنيف وكذلك الحال مع الاركيا ويمكن باختيار الكائن
Taxonomy المطلوب وكذلك اختيار المعلومات المراد معرفتها من استعمال متصفح التصنيف
. ( كما موضح في الشكل ( 17.2 browser
NCBI شكل 17.2 : جزء من واجهة تصفح التصنيف في

قواعد بيانات الايض والإنزيمات

من أهم قواعد البيانات المميزة التي تنضم تحت قواعد البيانات الحيوية هي قواعد البيانات
المتعلقة بالايض اذ تمثل التفاعلات الحيوية الحقيقية التي تؤدى بواسطة الإنزيمات. ولهذا
الغرض وجدت قواعد بيانات جديرة بالاهتمام منها:
BRaunschweig ENzyme Database 1-قواعد بيانات الإنزيمات منها القاعدة الألمانية ·
وكل من القاعدتين توفر إمكانيات البحث عن . ENZYME ,2-قاعدة (BRENDA)
الخاص به وربما كانت EC المعلومات الخاصة بالإنزيمات انطلاقا من اسم الإنزيم او رقم
: المبينة في الشكل 18.2 BRENDA معظم الروابط موضحة في الصفحة الرئيسة لقاعدة

الخاصة بالإنزيمات BRENDA شكل 18.2 : واجهة قاعدة

Metabolic pathway databases 3- قواعد بيانات المسارات الايضية ·
قواعد البيانات في هذا المجال تختلف من حيث الأسس التي استعملت في بناءها، او الأحياء
المنضوية تحتها.
4- قواعد البيانات الخاصة بالنباتات: واغلب المسارات الايضية في النباتات توجد ضمن شبكة
وهذه الشبكة مغطاة بدعم (PMN) Plant metabolic network خاصة بأيض النباتات هي
.Carnegie institution of science رسمي حكومي تنفذ من قبل معهد كارنكي للعلوم
والقواعد فيها مشتركة بين الكيمياء الحيوية وعلوم النبات



5- قواعد البيانات الخاصة بالكائنات المختلفة، وهي تضم مسارات ايضية لمختلف الأحياء
سواء كانت حقيقية النواة او بدائية النواة ومنها:
(KEGG) Kyoto Encyclopedia of Genes and Genomes * 6-قاعدة بيانات كيوتو
والإمكانيات التي توفرها القاعدة ربما تختصر في الشكل التالي (شكل 19.2 ) الذي يوضح
واجهة القاعدة.
ولعل مثالا يعطى في هذه الحالة حول الروابط والإمكانيات هو الكم الهائل من المعلومات حول
. ( عملية ايضية محددة مثل الفسفرة التأكسدية الموضحة في الشكل ( 20.

KEGG شكل 19.2 : واجهة قاعدة بيانات كيوتو للمسارات الايضية

سلبيات ومصداقية قواعد البيانات

هناك نوعين من السلبيات في قواعد البيانات وهما :
1- اعتماد بعض البرامج على اللبيانات التي يحللها الحاسوب , وهذه تحمل نسبة اخطاء معينة حيث ان المعلومات المستقاة من التجارب العملية داخل المختبرهي الأكثر وثوقا اذ ان هذه
المعلومات تكون تحت إشراف بايولوجيين متخصصين وبذلك تكون أكثر مصداقية من
البيانات التي يتم التنبؤ بها بالحاسوب

2- تكون قواعد البيانات عرضة للأخطاء مثل الأخطاء الطباعة والنقل والقص ومهما كانت هذه الاخطاء
صغيرة فإنها عرضة للتفاقم في الخطوات اللاحقة عند إجراء عمليات المعالجة والإعداد للقواعد
او عند استعمال القاعدة التي ستؤدي في النهاية الى استنتاجات خاطئة اذ تؤثر في الخرائط التي
يمكن ان تنتج وكذلك أخطاء في عمليات انزلاق الانترونات.


إرشادات للبحث عن المعلومات
ان الخوض في المعلوماتية الحيوية وقواعد بياناتها وبرامجها لا يكون مجدياً اذا كانت البدايات
خاطئة وهذا يؤدي الى مايلي ، 1-عدم وضوح الرؤيا 2- صرف الوقت والجهد ,3- الحصول على نتائج خاطئة . لذلك كان على الباحث ان يضع خطة واضحة وقد لا تكون دقيقة التفاصيل ولكنها
يمكن ان تكون مثمرة وفيما يلي بعض الإرشادات المساعدة وتشمل مايلي:
1- تحديد الهدف المطلوب من عملية البحث والدراسة ويعد هذا أهم أسباب النجاح في الوصول الى ·
الهدف بأقصر الطرق الصحيحة وقد يظهر أثناء عملية الوصول توفر معلومات أضافية يمكن
ان تكون مساعدة ولذلك كما ذكر أعلاه ان خطة البحث قد لا تكون دقيقة التفاصيل.

2-بناءا على الهدف المحدد ونوع المادة العلمية المراد الاستعلام عنها يتم اختيار قواعد البيانات ·
التي يتم استخدامها مع اختيار البرامج الملائمة لاستخدامها، كما في الامثلة التالية: -
وهذه القواعد يمكن ان تصنف هذه الجزيئات tRNA databases نختار الموقع المثالي وهو tRNA 1- عند دراسة ال
الخاصة وفقا للحامض الاميني الذي تحمله، 2- إمكانية الحصول على
Alignment , 3- كذلك تستعمل في تحليل الاصطفافات tRNA التراكيب الثانوية لجزيئات
كما في قاعدة عوائل جزيئات tmRNA , 4- توفر البيانات الوافية عن analysis
ولذلك فليس من المعقول استعمال برنامج لإيجاد التراكيب الثانوية . Rfam database RNA
لبروتين ما وادخال تواليات الحوامض النووية حيث سيرفضها البرنامج 5- ترجمة تواليات الحوامض النووية الى بروتينات

للبحث عن توالي معين في قواعد البيانات يفضل الخطوات التالية :

1- اختيار أكثر من قاعدة بيانات 2- اعتماد النتائج التي تعطي أكثر تطابقاً وأكثر عقلانية، لان بعض قواعد البيانات تكون غير مرتبة وتحوي تكرار وفائض من البيانات يمكن ان تؤثر في مخرجات النتائج.
3- اختيار البرامج الملائمة لأداء المهامات وفي هذا المجال يفضل استعمال أكثر من برنامج للتنفيذ. ·


وقبل اختيار البرامج يجب الاطلاع على بعض الجوانب منها:
1. نوع اللغة التي كتب بها البرنامج ويفضل استعمال البرنامج نفسه مكتوب بأكثر من لغة.
2. الاطلاع على الأسس التي كتب بها البرنامج والأخذ بنظر الاعتبار النواحي البايولوجية اذ ان
بعض البرامج تعتمد على صفات ليست حيوية وبالتالي يكون البرنامج ضعيفا"

3. اختبار القيم الإحصائية للبرنامج لأنها ستكون هي القيمة الترجيحية للنتائج التي يتم الحصول
عليها، وملاحظة الطرق الإحصائية التي بني عليها البرنامج.
4. الانتباه الى طريقة تنفيذ البرنامج والمصفوفات الترجيحية التي يعتمد عليها فبعض البرامج قد
تكون: - 1- سريعة التنفيذ 2- قليلة الدقة، اذ ان هذين المؤشرين لا يجتمعان في العادة، والسرعة العالية تكون على حساب الدقة.

5- يجب دراسة البرنامج، كي يتم التمكن من تفسير النتائج الظاهرة في مخرجاته وتفضل في هذه
الحالة البرامج التي تعطي الأشكال والصور لأنها توضح النتائج بشكل أفضل،

6- يجب ان تكون المخرجات بملفات نصية لإجراء التطابق فيما بينها والتمكن من استخدام
المؤشرات الإحصائية التي عادة ما تكون مدرجة في واجهة البرامج.

النيوكلوتيدات والحوامض النووية

هذه الجزيئات أكثر أهمية من ناحية الدراسات في المعلوماتية الحيوية إضافة الى البروتينات ,
و DNA النيوكلوتيدات لها وظائف مهمة وتشمل: 1-تشارك في معظم الفعاليات الحيوية ولعل أهمها مشاركتها في تركيب ال DNA &RNA اي الجزيئات الحاملة للمعلومات الوراثية ، 2-مشاركتها في تحولات الطاقة RNA
,3- كذلك تكون في بعض الأحيان جزءا مهما في الإنزيمات اي كعامل مساعد للانزيم ،GTP و ATP الحيوية مثل
,4- تشارك في عمليات نقل الإشارات وعمليات تنظيم الفعاليات الحيوية. Cofactor)
.

الأنظمة الحيوية وفعالياتها


Biomolecules جزيئات الحياة
والبروتينات بشكل رئيس، لان هذه RNA او DNA تتمثل في العادة بالجزيئات العملاقة الجزيئات الثلاث هي الجزيئات الرئيسة وتكون المواد الحيوية الأخرى هي مشتقات مباشرة او غير مباشرة عنها.

يتكون النيوكلوتيد من ثلاثة جزيئات هي :

او تكون رايبوز منقوص RNA 1- السكر وهذه في الغالب قد تكون رايبوز كما في ·
( كما في الشكل ( 10.3 DNA الأوكسجين في
2-مجموعة الفوسفات وهي اما ان تكون بمثابة مجموعة واحدة او اثنين او ثلاثة وترتبط الى ·
ذرة الكربون رقم 5 في السكر الخماسي 3- القواعد النتروجينية وهذه تقسم الى قسمين:
Pyrimidines 1- القواعد البريميدنية

Purines 2- القواعد البيورينية

شكل يوضح : تراكيب سكريات الحوامض النووية

Pyrimidines القواعد البريميدنية

قواعد نايتروجينية أحادية الحلقة، تركيبها موضح في أدناه وتضم ثلاثة قواعد مهمة في المواد الوراثية،
وتختلف القواعد فيما بينها في السلاسل الجانبية التي ترتبط الى ذرات كربون حلقة البريميدين وتشمل:
على الذرة الرابعة وهذه NH ) يحوي على مجموعة أمين C) Cytosine 1-السايتوزين
تشكل مناطق ساخنة لحدوث الطفرات نظرا لإزالة مجموعة الأمين 2- قاعدة الثايمين
(U) ) تحوي على مجموعة مثيل على الذرة الخامسة. 3-قاعدة اليوراسيل (T) Thymine
التي تحوي على الأوكسجين على الذرة الرابعة من الحلقة فضلا عن وجود اختلافات Uracil
في توزيع الأواصر المزدوجة في الحلقة وتحل في العادة محل الثايمين والتراكيب موضحة في
: الشكل التالي



الكورس الاول

شكل : القواعد النتروجينية البريميدنية

الكورس الاول


الكورس الاول


الكورس الاول


الكورس الاول

Purines القواعد البيورينية

)التي G) Guanine ), 2- الكوانين ( A) Adenine قواعد نتروجينية ثنائية الحلقة تشمل:1- الأدنين
تدخل في تركيب الحوامض النووية، تختلف القاعدتان في ترتيب الأواصر المزدوجة وكذلك
: ( المجاميع المرتبطة بذرات كربون الحلقة كما موضح في الشكل ( 12.3
شكل 12.3 : القواعد النتروجينية البيورينية

الكورس الاول



الكورس الاول


الكورس الاول


الكورس الاول


الكورس الاول

Nucleosides النيوكلوسيدات

المركبات الناتجة من اتحاد السكريات (سواء سكر الرايبوز او الرايبوز منقوص الأوكسجين)
مع احد القواعد النتروجينية، والارتباط يكون بين ذرة كربون الأولى لجزيئة السكر وذرة النتروجين
وتسمى اعتمادا على نوع السكر الداخل N-glycosidic bond من القاعدة النتروجينية بآصرة
: في تركيبها وهي موضحة في الشكل 13.3
شكل 13.3 : تركيب النيوكلوسيدات والنيوكلوتيدات

Nucleotides النيوكلوتيدات

جزيئات مكونة من : 1-سكر خماسي الرايبوز
اما الرايبوزي او الرايبوزي منقوص الأوكسجين)، ,2-القواعد النتروجينية وترتبط بالسكر
المذكورة أعلاه , 3- مجموعة فوسفات وترتبط ايضا بالسكر كما موضح في الشكل أعلاه :
والنيوكلوتيدات هي الوحدات المكونة للحوامض النووية. وتختلف النيوكلوتيدات من حيث عدد
(AMP) Adenosine ذرات الفوسفات المرتبطة فقد تكون مجموعة واحدة كما في
وكذلك Adenylate اي مجموعتين او ثلاثة ويطلق في العموم أسماء مختصرة للنيوكلوتيدات مثل monophosphate


تشترك السكريات في تسميتها:
مثل: Ribonucleotides فالمجموعة الحاوية على سكر الرايبوز تسمى
GMP Guanylate monophosphate
UMP Uridylate monophosphate
CMP Cytidylate monophosphate
اما المجموعة الحاوية على سكر الرايبوز منقوص الأوكسجين مثل:
dAMP deoxyadenylate monophosphate
dGMP deoxyguanylate monophosphate
dTMP deoxythymidylate monophosphate
dCMP deoxycytidylate monophosphate

-
Nucleic acids الحوامض النووية
جزيئات حيوية تتكون عندما ترتبط النيوكلوتيدات مع بعضها بواسطة جسور فوسفاتية ثنائية
بين ذرة كربون ' 3 للنيوكلوتيد وذرة ' 5 للنيوكلوتيد آخرتوالي النيوكلوتيدات المكونة للحوامض النووية
يعني ان ACCT والتوالي للنيوكلوتيد يعطي او يكتب عادة بالاتجاه من ' 5 الى ' 3 فمثلا التوالي
. في الموقع ' 3 T في الموقع ' 5 وان A Phosphodiester bridges الاستر

الشكل : توالي النيوكلوتيدات المكونة للحوامض النووية
يعني ان ACCT والتوالي للنيوكلوتيد يعطي او يكتب عادة بالاتجاه من ' 5 الى ' 3
. في الموقع ' 3 T في الموقع ' 5 وان A


DNA
ويمثل وديعة الصفات ، Nuclein يمثل الجزيئ الحيوي الأهم في الخلايا وكان يسمى النووين
الوراثية. وهو سلسلة من النيوكلوتيدات فيها سكر الرايبوز منقوص الأوكسجين، ترتبط مجموعة
الفوسفات لأحد النيوكلوتيدات مع جزيئة السكر للنيوكلوتيد الآخر، وبهذا الارتباط يتكون الجزء
DNA والجزء المتغير فيه هو القواعد النتروجينية. وتكون جزيئة ، DNA الثابت من تركيب
قطبية وذلك نتيجة لعملية الارتباط كما موضح في الشكل أعلاه .
:15.3

5 والنهاية '-triphosphate لذلك تكون إحدى نهايتي السلسلة حاملة لمجموعة الفوسفات الحرة
DNA 3. ويرتبط شريطين من جزيئات '-OH الثانية حاوية على مجموعة الهيدروكسيل الحرة
C,T مع البريميدنات G,A حيث تتقابل البيورينات Duplexes لتكوين الحلزونات المزدوجة
اي تكون متكاملة ولا T و A وآصرتين بين G و C وتتكون ثلاث أواصر هيدروجينية بين
يمكن ان تتقابل بشكل آخر، اي ان كل قاعدة بيورينية يجب ان تقابل قاعدة بريميدنية ولا يمكن
ان تتقابل البيورينات او البريميدنات مع بعضها وبمعنى آخر ان كل قاعدة نتروجينية أحادية
الحلقة يجب ان تقابل قاعدة ثنائية الحلقة اي تكون هناك علاقة مكانية تركيبية كما موضح في الشكل

وبذاك فان فتوالي القواعد النتروجينية في احد الأشرطة في الاتجاه ' 5 الى ' 3 يكون مكملا لتوالي
القواعد النتروجينية على الشريط الثاني والذي يكون بالاتجاه المعاكس اي من ' 3 الى ' 5، لذلك
DNA من أهم الخصائص التركيبية لجزيئة DNA كان تخصص ازدواج القواعد في أشرطة
العملاقة، والشكل ( 16.3 )يوضح هذه العلاقة.


DNA انتظام وتراكيب
وظيفتين مهمتين وهما: DNA يؤدي
1- استمرار المحافظة على المعلومات الوراثية في الأحياء الناتجة وهذا يعني ان كل المعلومات
اللازمة للحياة ووظائف الخلية مخزونة فيه.
-
2- التشفير لإعطاء البروتينات اللازمة لإدامة الحياة. ·
المعلومات الوراثية ولكن بتأثير ظروف أخرى تقع ضمن مجال الوراثة اللاجينية. DNA وينقل
على مناطق متخصصة تشمل 1- الجينات التي تحوي المعلومات الوراثية DNA ويحوي
لإنتاج البروتينات , 2- جينات أخرى لتنظيم الفعاليات على كافة المستويات وكل هذه المواد الوراثية
تنضم في تركيب يدعى الكروموسوم الذي يكاد يكون وحيدا في الخلايا بدائية النواة ويكون تراكيب
متعددة تمثل الكروموسومات في الخلايا حقيقية النواة. ومنها جاءت فكرة التواليات المشفرة
اي التي تترجم محتوياتها الى بروتينات وتواليات او مناطق أخرى غير مشفرة

الشفرات الوراثية

توليفة من ثلاث قواعد نتروجينية تقع في المناطق المشفرة يمكن ان تترجم الى حامض اميني
وتوجد 64 شفرة ( 34 ) لذا تسمى الشفرة الثلاثية لتعطي 20 حامض أميني وثلاث شفرات وقف
وهذا يعني ان هناك بعض الحوامض الامينية التي يشفر لها بأكثر (UGA, UAG, UAA)
من شفرة وراثية، وهذه حقيقة ما عدا الحامض الاميني الميثايونين والتربتوفان يشفر لهم بشفرة
Synonymous واحدة اما باقي الشفرات التي تشفر لحامض أميني فتسمى بالشفرات المترادفة
في حين يطلق على الشفرات التي تشفر لحوامض مختلفة بالشفرات غير المترادفة ، codons
ومعظم الشفرات المترادفة تختلف في الموقع الثالث للقاعدة النتروجينية .non-synonymous
. ( اي عند النهاية ' 3 كما موضح في الجدول ( 1.3



الكورس الاول



Start ووفقا للشفرات القياسية هناك شفرة بدء واحدة التي تبدأ بها تواليات المناطق المشفرة
وهذه تمثل أحد المؤشرات المستعملة في تصميم (AUG) وهي شفرة الميثايونين codon
البرامج للبحث عن الجينات المشفرة للتواليات غير المعروفة.
جدول 1.3 : الشفرات الوراثية والحوامض الامينية التي تشفر لها

استعمال الشفرات Codon usage

بسبب وجود وفرة في الشفرات الوراثية لذلك هناك عددا" من الحوامض الامينية التي
يشفر لها بشفرتين او ثلاثة او أربعة فضلا عن وجود حوامض يشفر لها بست شفرات وراثية
كما موضح في الجدول التالي ويلاحظ بالنسبة للحوامض التي يشفر لها بأكثر من شفرة انها
تشترك في القاعدتين الأوليتين وتختلف في القاعدة الثالثة.
او الشفرة المضادة Anticodon الحاوي على مقابل الشفرة tRNA وتقرأ الشفرات من قبل


ان الشفرات الوراثية القياسية المذكورة في الجدول ادناه تستعمل من قبل معظم البكتريا
والاركيا وفي أنوية الخلايا حقيقية النواة. وعلى العموم فان صفة القياسية لا تكون ثابتة في كل
للتربتوفان UGA تستعمل Spiroplasma و Mycoplasma أشكال الحياة المذكورة فمثلا في
وبعض
Ciliata في حين انها شفرة وقف بالنسبة للقياس العام، وكذلك الحال بالنسبة للهدبيات
والخمائر فهي تستعمل بعض شفرات الوقف للتشفير للكلوتامين. اما في مايتوكوندريا الخلايا
tRNA حقيقية النواة التي لها جينومها المستقل فهي تحوي على بدائل للشفرات الوراثية وتخلق
يعد Selenocysteine الخاصة بها. ومن الجدير بالذكر ان الحامض السستيئين السليني
ويوجد في بعض البكتريا وعدد من UGA الحامض الاميني الواحد والعشرون ويشفر ب
الأحياء حقيقية النواة


وكان يعتقد سابقا ان الشفرات المترادفة للحامض الاميني تحدث بشكل عشوائي في الجينوم
نظرا لانها في النهاية تعطي الحامض الاميني نفسه وهذا يعني ان كل الجينومات لها الفرصة
نفسها في تكرار استخدام الشفرات المترادفة، ولكن بعد زيادة الدراسات
تبين ان استعمال الشفرات ليس
عشوائيا وان بعض الجينومات تفضل استعمال بعض الشفرات للحوامض الامينية وسمي هذا
وهذا بطبيعة الحال يؤثر في تصميم البوادئ Codon usage bias بانحياز استعمال الشفرات
فيما اذا استعملت تواليات البروتين، لذلك فعند اختيار بروتين لتصميم البوادئ يفضل اختيار
.Degeneracy بروتين يكون بأقل ما يمكن من تشتت الشفرات
اما تفضيل استعمال شفرات معينة للحوامض الامينية فله عدة أسباب منها إتباع محتوى الجينوم
يصل الى 50 % التي تعد النموذج الدراسي GC محتوى جينومها من E. coli العام، فمثلا
: والموضحة بعض الحقائق عن استعمالها للشفرات في الجدول 2.3

الجينات وأنواعها

(في بعض RNA او DNA يعد الجين الوحدة الوراثية في الكائنات الحية ويمثل امتداد من
التي لها وظائف خاصة ، وهي RNA الفيروسات) التي تشفر للبروتين او جزيئات من
الوحدات التي تمرر الصفات الوراثية من الآباء الى الأبناء. والجينات الموصوفة بالكلام العام
للجين والتي تؤدي الى ظهور صفات متفاوتة في الأحياء وتختلف Alleles هي نسخ او صور
في توالي القواعد النتروجينية فيها.
تصنف الجينات الى عدة أصناف اعتمادا على وظيفتها وكما يلي :1- جينات تركيبية تقوم
بإنتاج البروتينات التي تدخل في بناء التراكيب الخلوية , 2- جينات تنظيمية تنتج البروتينات التي
تقوم بتنظيم الفعالية الحيوية. 3- الجينات الحاوية على الانترونات
او الجينات الموزائيكية ، 4- الجينات الخالية من الانترونات فتسمى Interpreted genes ويطلق عليها المتقطعة
اي انها لا تحوي أصلا على الانترونات Processed genes الجينات المستمرة او المعالجة
كما في معظم جينات الأحياء بدائية النواة او تكون قد أزيلت منها الانترونات. ويمكن ان تقسم
الى عوائل،


عوائل الجينات
العائلة الجينية هي التي تضم مجموعة من
الجينات التي فيها تشابه كبير في توالي القواعد او البروتينات، وتظهر فعاليات حيوية متشابهة
تقريبا وهذه يمكن ان تنشأ من تضاعف الجين ويمكن الكشف عنها بالتقنيات الخاصة بالعلاقات
التطورية وبرامج حاسوب خاصة مقرونة بطرق وموديلات إحصائية.
وفضلا عن ذلك فيمكن ان تقسم الى عوائل وفقا لأهميتها وكما يلي :1- الجينات الأساسية وهي التي تحتاجها الخلايا
للوظائف الرئيسة ولذلك يكون موقعها في الغالب قرب مناطق بدء التضاعف في البكتريا
لضمان زيادة التعبير عنها وثبوتها، 2- الجينات غير الأساسية وتحتاجها الخلايا تحت ظروف
خاصة مثل ظروف الإجهاد او غيرها.

وتعني الجينات المشابهة للجينات Pseudogenes 3- الجينات الكاذبة
العادية في العديد من الصفات الا انها فقدت وظيفتها لسبب ما مثل:أ- حصول طفرة أدت الى
تحويل شفرة معينة الى شفرة وقف ,ب - فقد أجزاء خاصة بعملية الانتساخ وهذه تسمى ايضا بالجينات
mRNA او انها تنشأ من الانتساخ العكسي لبعض أجزاء نسخ .Disabled genes المعطلة
ثم قد تعود لتستقر في الجينوم مرة أخرى وعندها تسمى الجينات المعالجة وهذا يعني ان لها صفات مماثلة
وتكون قد فقد ممهداتها او غيرها من العناصر التي تؤهلها للعمل كجينات ، cDNA لل
طبيعية ، او يمكن ان تنشأ من تضاعف الجين

وعلى العموم يميل البعض لتسميتها بالمادة

ولكن كشفت الدراسات الحديثة ان الجينات الكاذبة تقوم بعدد من Junk DNA الوراثية السقط
RNA الوظائف لعل أهمها: 1- عمليات التنظيم والتعبير الجيني ,2- تشفيرها لبعض جزيئات
. 3- مشاركتها في توليد الأمراض. siRNA المنظمة
DNA تغاير
مستويات مختلفة منها: 1- تغاير في الجينات والتي (DNA polymorphism DNA يشمل تغاير
, 2- تغاير في مستوى تركيب الكروموسوم مثل الحجم (Alleles عبر عنها بالمتشابهات (الاليلات
والكروماتين الحقيقي Heterochromatin وموقع المريكزات ، ووجود الكروماتين المتباين
,3- تغاير في منتجات الجين يعني التغيير في البروتينات الناتجة من .Euchromatin
حيث الألفة والفعالية وغيرها، وكذلك النمط المظهري. وكل التغايرات تاتي من تغيير
في توالي القواعد النتروجينية، وتعد من المظاهر المهمة للتعرف العديد من المتعلقات
SNPs الوراثية، ومن أفضل الأمثلة عليها هي : تغايرات النيوكلوتيد الواحد



تشريح الجين
مثلما ذكر في موقع آخر ان الجين المشفر هو المسئول عن إنتاج بروتين فعال وهذا يعني انه
DNA يحوي على:1- عدد من الشفرات التي تعطي الحوامض الامينية، 2- يشمل تواليات من
والتي تشمل : أ- سيطرات لانها تسيطر وتنظم التعبير الجيني وقد تكون هذه التواليات المنظمة تبعد بالآلاف القواعد النتروجينية
عن المنطقة المشفرة في خلايا بدائية النواة وقد يصل بعد هذه المناطق مثل المشجعات
الى 50 كيلو قاعدة في بعض جينات الخلايا حقيقية النواة. Enhancers
وهذه السيطرات قد تكون:1- موجبة (وهو ارتباط بروتين او معقد بروتيني الى الممهد حتى يفتحه
والا يكون مغلقا) او تكون,2- سيطرات سالبة (وهي كون الجين مفتوح التعبير ويغلق عند ارتباط
بروتين او مادة أخرى) . 2- مناطق لا تترجم
وهي تواليات أخرى
وتكون موجودة عند Untranslated regions (UTRs) تحيط بالجين وهي مناطق لا تترجم
Half-life الطرف ' 5 و ' 3 وهذه المناطق تؤثر في التعبير الجيني مثل التحكم بالعمر النصفي
الناتجة وتكون مجاورة للاكسون الأول (' 5) والاكسون الأخير (' 3).والشكل mRNA لجزيئات
20.3 ) يوضح تشريح بسيط لجين في الخلايا بدائية النواة . )
.


شكل 21.3 : تشريح جين في خلايا حقيقية النواة وبعض المعالجات التي تجري عليها

جينات الخلايا حقيقية النواة هي أكثر تعقيدا من بدائية النواة اذ تحوي على الانترونات (مناطق غير مشفرة)
والتي عند حدوث بعض الطفرات فيها يمكن ان يؤدي الى الأمراض ومناطق الاكسونات وهي
المناطق المشفرة وحدوث الطفرات فيها يمكن ان يؤدي الى الأمراض ايضا، فضلا عن وجود
مناطق منظمة أخرى والشكل التالي ( 21.3 ) يوضح تشريح الجين وبعض العمليات التي تجري
عليه أثناء التعبير الجيني


مناطق مهمة جدا، وهي اكثر ثباتا من المناطق المشفرة، UTRs وتمثل المناطق غير المشفرة
وتساهم في وظائف عدة منها : 1- عملية التنظيم اذ تنضم بعض المناطق التي تكون مواقعا" لارتباط بعض البروتينات
بين النواة RNA , 2- تنظيم نقل Antisense RNA النقيضة RNA وجزيئات
.mRNA والمساهمة في الترجمة وثبوت mRNA والسايتوبلازم ,3- تحديد مواقع
4- تحوي على العديد من مواقع الارتباط لعدد من معقدات الانتساخ , 5- تساهم
40 من وحدات الرايبوزوم وربطها بتركيب الرايبوزوم لبدء عملية الترجمة. S في جلب الوحدة

5 ووجود عناصر أخرى الى يسار شفرة البدء تكون مهمة في تنظيم ' UTR ان لطول منطقة
وقد وجد ان إحاطة شفرة البدء بتواليات ملائمة وقصر منطقة ' 5 .mRNA انتساخ وتخليق
يشجع عمليات الانتساخ في حين ان طول المنطقة يؤدي الى ضعف الانتساخ. ومن UTRs
Internal ribosome entry sites ومن التواليات الأخرى الموجودة في الطرف ' 5 هي تواليات ادخال الرايبوسوم
ووظيفتها: تشفر البروتينات المنظمة. mRNA والتي توجد في جزيئات IRESs

3 )فهي تلعب دورا مهما فيميلي :1- فلق النسخ أثناء عمليات الخياطة UTRs اما المنطقة الغير مترجمة عند الطرف3 (
2- إضافة ذيل الأدنين ,3- التصدير من النواة , 4- تنظيم الاستنساخ , 5- تثبيت الجزيئة المستنسخة.
mRNA 6- تحوي على تواليات تعمل في التنظيم السالب الذي يحصل بعد الاستنساخ ، 7- تقوم بإحباط ترجمة
) وذلك يكون بازدواج الجزيئات الأخيرة مع قطع بروتينية التي sRNA) RNA بواسطة الجزيئات الصغيرة من
تشفر للبروتينات المنظمة. 8- تحوي على: -
مواقع ترتبط عليها عدد من العوامل المشاركة لتعمل على إنهاء الترجمة وإطلاق الببتيدات المخلقة.



طبيعة الجينات في الأحياء
المراد هنا احتواء الجينات على المناطق المشفرة وغير المشفرة. ففي معظم جينات الخلايا
بدائية النواة تكون كل مناطق الجين مشفرة اي بدون وجود الانترونات
وأكثر من ذلك ان بعض الجينات المشتركة (في الغالب) في مسار ايضي واحد تتجمع في
بنسق يضم معه تراكيب خاصة هي : 1- ممهد واحد ,2- عناصر تنظيم بنسخ واحدة لتكوين الاوبرونات وتكون النسخ
الناتجة من انتساخها ذات رسائل متعددة تجري معالجتها فيما بعد.
اما الجينات في الخلايا حقيقية النواة فهي تكون حاوية على الاكسونات والانترونات وتكون
هناك علاقة واضحة (طردية) بين عدد الانترونات الكلي مع درجة التعقيد في الكائن. وترقم كل
من الاكسونات والانترونات بالاتجاه من ' 5 الى ' 3 في الشريط المشفر او الحساس .

الانترونات: وهذه لها مواقع مختلفة.

Phase اما ان تكون: 1- بين الشفرات الوراثية ويطلق عليها النوع الصفري 0 ·
Phase 2- تكون داخل الشفرة بعد القاعدة النتروجينية الأولى 1 ·

Phase 3- تكون داخل الشفرة بعد القاعدة الثانية 2 ·
ويكون النوع الصفري هو الشائع

ويمكن ان تقسم الانترونات الى عدة مجاميع وفقا لمواقعها ومنها:
وتكون هذه خاصة لأنها تزال بإنزيمات غير التي tRNA 1- انترونات خاصة في جينات
اذ تجرى عملية فسفرة للبروتينات المشتركة ثم يلحم طرف جزيئة mRNA يقطع بها
بإنزيمات أخرى. tRNA
وتوجد في rRNA و tRNA 2- انترونات المجموعة الأولى شائعة الانتشار في
المايتوكوندريا والبلاستيدات وكذلك في الجينوم النووي للأحياء اللافقرية وبعض
وهذه المجموعة Eubacteria العاثيات البكترية وبعض جينومات البكتريا الحقيقية
يمكن لبعضها ان يستأصل دون مشاركة البروتينات مما يشير الى الفعالية الإنزيمية
.RNA لبعض جزيئات



3- انترونات المجموعة الثانية توجد في المايتوكوندريا والبلاستيدات الخضر وكذلك بعض ·
يمكن لبعضها .Proteobacteria وبعض البكتريا الاولية Cyanobacteria أنواع البكتريا المزرقة
الانفلاق ذاتيا وتشارك بعض البروتينات في عمليات خياطها كما هو الحال مع
المجموعة الأولى اي هناك تشابه بين المجموعتين، لذلك يعتقد ان انترونات
المجموعة الأولى وانترونات المجموعة الثانية تكون ذات علاقة تطورية، ويحتمل ان
قد نشأت من هذه المجموعة. (small nuclear RNA) snRNA

ويطلق (pre-mRNA) RNA 4- المجموعة الأخرى هي انترونات النسخ الأولية لل ·
الموجودة في النواة. Spliceosomal RNA عليها جزيئات الخياطة

ومن جهة ثانية يمكن ملاحظة ان الانترونات الموجودة في الجينات العالية التعبير تكون أقصر
من تلك الموجودة في الجينات الواطئة التعبير، وهذا الاختلاف يكون كبيرا في الإنسان ، حيث
يكون طول الانترونات (كمعدل) 14 مرة أقصر في الجينات عالية التعبير مقارنة بتلك التي
يعبر عنها ببطيء.

وظيفة الانترونات: تقوم الانترونات بأكثر من وظيفة:

1- تنظيم التعبير الجيني للجين الذي توجد فيه.
2- إنشاء جينات جديدة وذلك بجمع الاكسونات بتشكيلات مختلفة أثناء عمليات إدلاف
الاكسونات والتي يوجد العديد منها في جينومات اللبائن.
3- مشاركتها في تكوين الجسيمات النووية وتنظيم الكروماتين وهي أكثر فعالية في
هذا المجال من الاكسونات.


Exons الاكسونات
تعد المناطق المشفرة في الجينات. وفي العادة تكون شفرة البدء في بداية الاكسون الأول وشفرة الوقف في نهاية الاكسون الأخير. وتختلف نسب الاكسونات في الجين الواحد فمثلا في:
الإنسان هناك حوالي 9.08 \جين
ذبابة الفاكهة حوالي 4.45 \جين
حوالي 6.71 \جين C. elegans الدودة

نبات رشاد الصخر حوالي 6.63 \جين

. وفي الإنسان تكون الاكسونات مفرقة ويتراوح عددها من 9 ويمكن ان يصل الى 43
أنواع الاكسونات
تقسم الاكسونات الى أنواع اعتمادا على مواقعها في الجين:
وتمتد هذه من شفرة البدء الى أول موقع لفلق وخياطة Initial exons 1-اكسونات البداية ·
الانترون الذي يليه والمسمى بالموقع الواهب .
ويبدأ من موقع استقبال الى موقع الواهب الذي Internal exons 2-الاكسونات الداخلية ·
يليه.
ويمتد من آخر موقع استقبال الى شفرة الوقف Final exons 3-الاكسونات النهائية ·
للجين.
وهذه توجد في الجينات الخالية من الانترونات Single exons 4-الاكسونات المفردة ·
: وتبدأ من شفرة البدء الى شفرة الوقف وهذه الأنواع موضحة في الشكل 22.3

شكل 22.3 : أنواع الاكسونات


شكل 22.2 : العلاقة بين العدد المطلق من الانترونات وحجم الانترون في قاعدة بنك الجينات

أعداد الجينات

من أهم مهام تهميش الجينوم هو محاولة إيجاد العدد الدقيق لعدد الجينات الكلي في الجينوم،
وهذه قد تكون سهلة وواضحة بالنسبة للأحياء بدائية النواة نظرا لبساطة تراكيبها الجينية ولكن
في الأحياء حقيقية النواة وخاصة الإنسان فان المسألة تكون اكثر تعقيدا وذلك نظرا للتركيب
المعقد لجينوماتها التي تشوش على عمليات التنبؤ بالجينات. وقبل اكتمال تحديد تواليات الجينوم البشري ب
120,000 جين, ولكن بعد تحديد التوالي للجينوم البشري كان يعتقد ان هناك بين 20,000
30,000 وان كان الرقم لا يزال غير – برامج معقدة لإيجاد الجينات هبط العدد الى 25,000
متفق عليه بين جميع الباحثين ولكن الاتفاق العام ان العدد الكلي لجينات الجينوم البشري لا يزيد
عن 30،000 والشكل التالي ( 23.3 ) يوضح أعداد الجينات لعدد من الكائنات.
شكل 23.3 : أعداد الجينات لأحياء مختلفة

أعداد الجينات

من أهم مهام تهميش الجينوم هو محاولة إيجاد العدد الدقيق لعدد الجينات الكلي في الجينوم،
وهذه قد تكون سهلة وواضحة بالنسبة للأحياء بدائية النواة نظرا لبساطة تراكيبها الجينية ولكن
في الأحياء حقيقية النواة وخاصة الإنسان فان المسألة تكون ليست سهلة وذلك نظرا للتركيب
المعقد لجينوماتها التي تشوش على عمليات التنبؤ بالجينات

وقبل اكتمال تحديد تواليات الجينوم كان يعتقد ان عدد الجينات يتراوح بين 20 الف الى 120 الف
لكن بعد تحديد التوالي واستخدام برامج متقدمة ومتطورة تبين ان العدد لايزيد عن 30 الف جين


والملاحظ من الهتوكرام ان الكثافة الجينية
للإنسان هي الأقل وتقرب من 20 والعدد القليل لجينات الإنسان الذي يقدر بخمسة أضعاف
جينات خميرة الخبز واقل من جينات نبات الرز والمقاربة للفيران لا يتفق مع درجة التعقيد
للأحياء، وهنا يبدو ان التعقيد لا يتعلق بعدد الجينات وانما هناك جوانب أخرى لظهور التعقيد
وضمن مستويات أخرى منها:
الخياطة البديلة ·
التعبير الجيني ·
التنظيم ·
التعبير ألبروتيني ·
التحويرات ·
التداخل بين الجزيئات



رفعت المحاضرة من قبل: Mena Alhaialy
المشاهدات: لقد قام 36 عضواً و 1741 زائراً بقراءة هذه المحاضرة








تسجيل دخول

أو
عبر الحساب الاعتيادي
الرجاء كتابة البريد الالكتروني بشكل صحيح
الرجاء كتابة كلمة المرور
لست عضواً في موقع محاضراتي؟
اضغط هنا للتسجيل