Ποια είναι η διαφορά μεταξύ FASTA και FASTQ

Πίνακας περιεχομένων:

Ποια είναι η διαφορά μεταξύ FASTA και FASTQ
Ποια είναι η διαφορά μεταξύ FASTA και FASTQ

Βίντεο: Ποια είναι η διαφορά μεταξύ FASTA και FASTQ

Βίντεο: Ποια είναι η διαφορά μεταξύ FASTA και FASTQ
Βίντεο: ✅ Εσύ το γνωρίζεις; Ποια είναι η διαφορά ανάμεσα στα καφέ και τα άσπρα αυγά; 2024, Ιούλιος
Anonim

Η βασική διαφορά μεταξύ FASTA και FASTQ είναι ότι το FASTA είναι μια μορφή που βασίζεται σε κείμενο που αποθηκεύει μόνο αλληλουχίες νουκλεοτιδίων ή πρωτεϊνών, ενώ το FASTQ είναι μια μορφή βασισμένη σε κείμενο που αποθηκεύει τιμές ποιότητας τόσο της αλληλουχίας όσο και της σχετικής αλληλουχίας.

Η βιοπληροφορική είναι ένα πεδίο που χρησιμοποιεί διαφορετικό λογισμικό για την ανάλυση και την κατανόηση βιολογικών δεδομένων, ειδικά όταν το σύνολο των δεδομένων είναι πολύπλοκο και μεγάλο. Αυτός ο τομέας συνδυάζει τη βιολογία, τη χημεία, τη φυσική, την επιστήμη των υπολογιστών, τη μηχανική πληροφοριών, τα μαθηματικά και τη στατιστική για την ανάλυση και την ερμηνεία βιολογικών δεδομένων. Το FASTA και το FASTQ είναι δύο μορφές αναπαράστασης ακολουθιών στον τομέα της βιοπληροφορικής για την ευθυγράμμιση και την ανάλυση αλληλουχιών. Στην πραγματικότητα, το FASTQ είναι μια μορφή αρχείου ακολουθίας που επεκτείνει τη μορφή FASTA με τη δυνατότητα αποθήκευσης της ποιότητας ακολουθίας.

Τι είναι το FASTA;

Το FASTA είναι ένα λογισμικό ευθυγράμμισης για αλληλουχία DNA και πρωτεϊνών. Το λογισμικό FASTA χρησιμοποιεί μορφή FASTA. Είναι μια μορφή που βασίζεται σε κείμενο που αντιπροσωπεύει είτε αλληλουχίες νουκλεοτιδίων είτε αλληλουχίες αμινοξέων (πρωτεϊνών). Εδώ, οι κωδικοί ενός γράμματος αντιπροσωπεύουν και τις δύο αυτές ακολουθίες. Το FASTA είναι ένα σημαντικό εργαλείο στους τομείς της βιοπληροφορικής και της βιοχημείας. Αυτή η μορφή επιτρέπει τα ονόματα και τα σχόλια ακολουθιών να προηγούνται των ακολουθιών.

FASTA vs FASTQ σε μορφή πίνακα
FASTA vs FASTQ σε μορφή πίνακα

Εικόνα 01: Ακολουθία FASTA

Αυτή η μορφή προέρχεται από το λογισμικό FASTA και εισήχθη από τους David J. Lipmann και William R. Pearson το 1985. Το εργαλείο FASTA είχε πολλές τροποποιήσεις με την πάροδο του χρόνου και η τελευταία έκδοση αποτελείται από προγράμματα για πρωτεΐνη:πρωτεΐνη, DNA:DNA, πρωτεΐνη:μεταφρασμένο DNA (με μετατοπίσεις πλαισίου) και διατεταγμένες ή μη διατεταγμένες αναζητήσεις πεπτιδίων. Το FASTA διαβάζει μια δεδομένη αλληλουχία νουκλεοτιδίων ή αμινοξέων και αναζητά την αντίστοιχη βάση δεδομένων αλληλουχιών χρησιμοποιώντας τοπική στοίχιση αλληλουχιών για να βρει ταίριασμα παρόμοιων αλληλουχιών βάσης δεδομένων.

Τι είναι το FASTQ;

Το FASTQ είναι ένα λογισμικό ευθυγράμμισης που χρησιμοποιείται στον τομέα της βιοπληροφορικής, το οποίο αποθηκεύει τόσο μια βιολογική αλληλουχία (συνήθως αλληλουχία νουκλεοτιδίων) όσο και τις αντίστοιχες βαθμολογίες ποιότητας. Το FASTQ αναπτύχθηκε αρχικά για τη δέσμη μιας ακολουθίας μορφοποιημένης FASTA και των σχετικών δεδομένων ποιότητας από το Wellcome Trust Sanger Institute. Με την ανάπτυξη στον τομέα της βιοπληροφορικής, το FASTQ έγινε το de facto πρότυπο για την αποθήκευση της παραγωγής πολλών οργάνων αλληλουχίας υψηλής απόδοσης.

Η μορφή FASTQ χρησιμοποιεί τέσσερις διαφορετικές γραμμές ανά ακολουθία. Η γραμμή 1 ξεκινά με χαρακτήρα @ και ακολουθείται από ένα αναγνωριστικό ακολουθίας (παρόμοιο με μια γραμμή τίτλου FASTA). Η γραμμή 2 αποτελείται από ακατέργαστα γράμματα ακολουθίας. Στη γραμμή 3, η ακολουθία ξεκινά με έναν χαρακτήρα «+» και προαιρετικά ακολουθείται από το ίδιο αναγνωριστικό ακολουθίας. Η γραμμή 4 κωδικοποιεί τις τιμές ποιότητας για την ακολουθία στη γραμμή 2 και πρέπει να αποτελείται από τον ίδιο αριθμό συμβόλων με τα γράμματα της ακολουθίας.

Ποιες είναι οι ομοιότητες μεταξύ FASTA και FASTQ;

  • FASTA και FASTQ είναι εργαλεία ευθυγράμμισης.
  • Είναι δύο μορφές αναπαράστασης ακολουθιών.
  • Και τα δύο σχετίζονται με τον τομέα της βιοπληροφορικής.
  • Τόσο το FAST όσο και το FASTQ είναι σημαντικά εργαλεία για σκοπούς αποθήκευσης και αλληλουχίας.
  • Το FASTQ είναι μια επέκταση της μορφής FASTA με δυνατότητα αποθήκευσης της ποιότητας ακολουθίας.

Ποια είναι η διαφορά μεταξύ FASTA και FASTQ;

Το FASTA είναι μια μορφή που βασίζεται σε κείμενο που αποθηκεύει μόνο αλληλουχίες νουκλεοτιδίων ή πρωτεϊνών, ενώ το FASTQ είναι μια μορφή που βασίζεται σε κείμενο που αποθηκεύει τιμές ποιότητας τόσο της αλληλουχίας όσο και της σχετικής αλληλουχίας. Έτσι, αυτή είναι η βασική διαφορά μεταξύ FASTA και FASTQ. Επιπλέον, το FASTA αποθηκεύει θραύσματα αλληλουχίας μετά την αντιστοίχιση, ενώ το FASTQ αποθηκεύει τμήματα αλληλουχίας πριν από τη χαρτογράφηση. Επιπλέον, μια άλλη διαφορά μεταξύ FASTA και FASTQ είναι ότι το FASTA αποτελείται από μία γραμμή περιγραφής και το FASTAQ αποτελείται από τέσσερις γραμμές.

Το παρακάτω infographic παρουσιάζει τις διαφορές μεταξύ FASTA και FASTQ σε μορφή πίνακα για σύγκριση δίπλα-δίπλα.

Σύνοψη – FASTA vs FASTQ

Η βιοπληροφορική χρησιμοποιεί διαφορετικές μορφές ακολουθιών, όπως FASTA και FASTQ, κ.λπ. Το FASTA αποθηκεύει θραύσματα αλληλουχίας μετά την αντιστοίχιση, ενώ το FASTQ αποθηκεύει τα τμήματα αλληλουχίας πριν από την αντιστοίχιση. Το FASTA είναι ένα λογισμικό ευθυγράμμισης για αλληλουχία DNA και πρωτεϊνών. Αποτελείται από προγράμματα για πρωτεΐνη:πρωτεΐνη, DNA:DNA, πρωτεΐνη:μεταφρασμένο DNA (με μετατοπίσεις πλαισίου) και διατεταγμένες ή μη διατεταγμένες αναζητήσεις πεπτιδίων. Το FASTQ είναι ένα λογισμικό ευθυγράμμισης που χρησιμοποιείται στον τομέα της βιοπληροφορικής και αποθηκεύει τόσο μια βιολογική αλληλουχία (συνήθως αλληλουχία νουκλεοτιδίων) όσο και τις αντίστοιχες βαθμολογίες ποιότητας. Το FASTA αποτελείται από μία γραμμή περιγραφής και το FASTQ αποτελείται από τέσσερις γραμμές. Έτσι, αυτό συνοψίζει τη διαφορά μεταξύ FASTA και FASTQ.

Συνιστάται: