Ανάγκη ανάπτυξης του συστήματος ΟΠΤΟΠΟΙΗΣΗ:
Παρά τη συνεχή πρόοδο στις ασύρματες τηλεπικοινωνίες η μετάδοση βίντεο από και προς συσκευές ευρείας χρήσης (κινητά τηλέφωνα, υπολογιστές παλάμης κλπ) παραμένει περιορισμένη κυρίως λόγω της κακής ποιότητας του μεταδιδόμενου βίντεο σε σχέση με το κόστος της μετάδοσης.
Η κωδικοποίηση με βάση την αντίληψη έχει τη φιλοσοφία της χονδροειδούς συμπίεσης του μέρους εκείνου της πληροφορίας η οποία δεν γίνεται αντιληπτή από τα ανθρώπινο οπτικό και ακουστικό σύστημα. Η λογική αυτή χρησιμοποιήθηκε σε σειρά προτύπων συμπίεσης βίντεο μεταξύ των οποίων η σειρά προτύπων MPEG. Η ανάγκη όμως για συμπίεση σε υψηλότερους βαθμούς απέδειξε ότι τα πρότυπα MPEG δεν είναι επαρκή για μετάδοση αποδεκτής ποιότητας βίντεο διαμέσου τηλεπικοινωνιακών καναλιών πολύ χαμηλού εύρους ζώνης.
Η κωδικοποίηση σημάτων βίντεο με βάση την οπτική προσοχή (visual attention) βασίζεται στη λογική της λεπτομερέστερης αναπαράστασης-κωδικοποίησης των περιοχών εκείνων της εικόνας / βίντεο στα οποία εστιάζεται η ανθρώπινη προσοχή είτε ενσυνείδητα (consciously) είτε υποσυνείδητα (subconsciously). Για να επιτευχθεί όμως η κωδικοποίηση με βάση την οπτική προσοχή θα πρέπει να αναπτυχθούν μοντέλα που προσομοιάζουν τον τρόπο με τον οποίο εστιάζεται η προσοχή των ανθρώπων σε μία σκηνή. Παρόλο που κάποια τέτοια μοντέλα έχουν προταθεί, στην αντίστοιχη επιστημονική βιβλιογραφία, αυτά αφορούν αποκλειστικά την υποσυνείδητη εστίαση οπτικής προσοχής η οποία όμως δεν είναι συνήθης όταν οι άνθρωποι παρακολουθούν κάποιο βίντεο. Σε αυτή την περίπτωση οι άνθρωποι γνωρίζουν τι πρέπει να αναζητήσουν στο μεταδιδόμενο βίντεο (για παράδειγμα το πρόσωπο του συνομιλητή τους).
Περιγραφή έργου:
Το έργο ΟΠΤΟΠΟΙΗΣΗ φιλοδοξεί να αναπτύξει μοντέλα τα οποία συνδυάζουν υποσυνείδητη και ενσυνείδητη εστίαση οπτικής προσοχής για εντοπισμό περιοχών ενδιαφέροντος (ROI - Regions Of Interest) ώστε να καταστεί εφικτή η ανάπτυξη σχημάτων συμπίεσης βίντεο υψηλής απόδοσης τα οποία θα επιτρέψουν τη μετάδοση αποδεκτής ποιότητας βίντεο διαμέσου τηλεπικοινωνιακών καναλιών χαμηλού εύρους ζώνης. Η επιλεκτική οπτική προσοχή (selective visual attention) είναι ο μηχανισμός, ο οποίος μας επιτρέπει να κατευθύνουμε το βλέμμα μας προς ενδιαφέροντα αντικείμενα του περιβάλλοντος μας. Ο έλεγχος της μπορεί να βασίζεται σε bottom-up σήματα εξαιτίας μη αναμενόμενων και ισχυρών ερεθισμάτων (π.χ. ακαριαία λάμψη) ή top-down σήματα που κατευθύνονται από κάποιον επιθυμητό στόχο (π.χ. η εύρεση ενός γνωστού προσώπου στο πλήθος). H οπτική προσοχή επιτρέπει την επικέντρωση σε ένα μικρό, αλλά σημαντικό για την κατανόηση της σκηνής, μέρος της οπτικής πληροφορίας και το κατευθύνει στις αντίστοιχες περιοχές επεξεργασίας του ανθρώπινου εγκεφάλου. Η διαδικασία της αλλαγής του κέντρου προσοχής (focus of attention) αποτελεί μια στρατηγική του όλα για τον νικητή (winner-take-all), στην οποία ορισμένα χαρακτηριστικά του κύριου χάρτη τονίζονται, ενώ άλλα αγνοούνται. Με αυτόν τον τρόπο γίνεται εφικτός ο διαχωρισμός του προβλήματος της αναγνώρισης/ κατανόησης σκηνής /αντικειμένου σε μικρότερα λιγότερο απαιτητικά σε υπολογισμούς προβλήματα οπτικής ανάλυσης.
Αναμενόμενα αποτελέσματα:
-
Επέκταση των υπαρχόντων τεχνικών μοντελοποίησης της υποσυνείδητης προσοχής (bottom-up approaches) με ενσωμάτωση top-down πληροφορίας ώστε να μοντελοποιείται αποτελεσματικά και η ενσυνείδητη εστίαση προσόχής,
-
Χρήση των μοντέλων που θα αναπτυχθούν για πειραματικό έλεγχο της συμπίεσης, με βάση την εστίαση προσοχής, σε μετάδοση βίντεο μέσω καναλιών χαμηλού εύρους ζώνης,
-
Σε βάθος γνώση των βιολογικών και υπολογιστικών μοντέλων που σχετίζονται με την οπτική αντίληψη και δυνατότητες χρήσης αυτών σε άλλες εφαρμογές όπως ανάκληση με βάση το περιεχόμενο (content based retrieval) από βάσεις δεδομένων με πολυμεσικό υλικό.
|