Ο μέγιστος λόγος σήματος προς θόρυβο (PSNR) είναι ο λόγος μεταξύ της μέγιστης ισχύος ενός σήματος και της ισχύος του θορύβου του σήματος. Οι μηχανικοί χρησιμοποιούν συνήθως το PSNR για τη μέτρηση της ποιότητας των ανακατασκευασμένων εικόνων που έχουν συμπιεστεί. Κάθε στοιχείο εικόνας (pixel) έχει μια τιμή χρώματος που μπορεί να αλλάξει όταν μια εικόνα συμπιέζεται και μετά δεν συμπιέζεται. Τα σήματα μπορούν να έχουν ένα ευρύ δυναμικό εύρος, επομένως το PSNR εκφράζεται συνήθως σε ντεσιμπέλ, το οποίο είναι λογαριθμική κλίμακα.
Ορίστε το bel και το ντεσιμπέλ. Το bel ορίζεται μαθηματικά ως LB = log10 (P1 / P0) όπου τα P1 και P0 είναι δύο ποσότητες που βρίσκονται στις ίδιες μονάδες μέτρησης. Το ντεσιμπέλ είναι 0,1 bel, οπότε η τιμή ντεσιμπέλ LdB είναι LdB = 10 log10 (P1 / P0).
Ορίστε το μέσο τετράγωνο σφάλμα (MSE) μεταξύ δύο μονοχρωματικών εικόνων, όπου η μία εικόνα θεωρείται προσέγγιση του άλλου. Το MSE μπορεί να περιγραφεί ως ο μέσος όρος του τετραγώνου των διαφορών στις τιμές των pixel μεταξύ των αντίστοιχων pixel των δύο εικόνων.
Εκφράστε MSE μαθηματικά από την περιγραφή στο Βήμα 1. Έχουμε λοιπόν MSE = 1 / mn [?? (I (i, j) - K (i, j)) ^ 2] όπου I και K είναι πίνακες που αντιπροσωπεύουν τις εικόνες που συγκρίνονται. Οι δύο συνόψεις εκτελούνται για τις διαστάσεις \ "i \" και \ "j. \" Επομένως το I (i, j) αντιπροσωπεύει την τιμή του pixel (i, j) της εικόνας I.
Προσδιορίστε τη μέγιστη δυνατή τιμή των pixel στην εικόνα I. Συνήθως, αυτό μπορεί να δοθεί ως (2 ^ n) - 1 όπου n είναι ο αριθμός των bit που αντιπροσωπεύουν το pixel. Έτσι, ένα pixel 8-bit θα έχει μέγιστη τιμή (2 ^ 8) - 1 = 255. Αφήστε τη μέγιστη τιμή για τα εικονοστοιχεία στην εικόνα I να είναι MAX.
Εκφράστε το PSNR σε ντεσιμπέλ. Από το Βήμα 1, έχουμε την τιμή ντεσιμπέλ LdB ως LdB = 10 log10 (P1 / P0). Τώρα ας P1 = MAX ^ 2 και P0 = MSE. Έχουμε τότε PSNR = 10 log10 (MAX ^ 2 / MSE) = 10 log10 (MAX / (MSE) ^ (1/2)) ^ 2 = 20 log10 (MAX / (MSE) ^ (1/2)). Επομένως, PSNR = 20 log10 (MAX / (MSE) ^ (1/2)).