Q&A: Η Cathy Wu για την ανάπτυξη αλγορίθμων για την ασφαλή ενσωμάτωση ρομπότ στον κόσμο μας


Η Cathy Wu είναι ο Gilbert W. Winslow Επίκουρος Καθηγητής Πολιτικής και Περιβαλλοντικής Μηχανικής και μέλος του Ινστιτούτου MIT για Δεδομένα, Συστήματα και Κοινωνία.

Από την Kim Martineau | MIT Schwarzman College of Computing

Κάθι Γου είναι ο Gilbert W. Winslow Επίκουρος Καθηγητής Πολιτικής και Περιβαλλοντικής Μηχανικής και μέλος του MIT Institute for Data, Systems, and Society. Ως προπτυχιακός, ο Wu κέρδισε τον πιο σκληρό διαγωνισμό ρομποτικής του MIT και ως μεταπτυχιακός φοιτητής παρακολούθησε το πρώτο μάθημα στο Πανεπιστήμιο της Καλιφόρνια στο Μπέρκλεϋ για τη βαθιά ενισχυτική μάθηση. Τώρα πίσω στο MIT, εργάζεται για να βελτιώσει τη ροή των ρομπότ στις αποθήκες της Amazon κάτω από το Science Hub, μια νέα συνεργασία μεταξύ του τεχνολογικού γίγαντα και του MIT Schwarzman College of Computing. Έξω από το εργαστήριο και την τάξη, μπορείτε να βρείτε τον Wu να τρέχει, να σχεδιάζει, να ρίχνει latte στο σπίτι και να παρακολουθεί βίντεο στο YouTube σχετικά με τα μαθηματικά και την υποδομή μέσω του 3Blue1Brown και του Practical Engineering. Πρόσφατα έκανε ένα διάλειμμα από όλα αυτά για να μιλήσει για τη δουλειά της.

Ε: Τι σας οδήγησε στην πορεία προς τη ρομποτική και τα αυτόνομα αυτοκίνητα;

ΕΝΑ: Οι γονείς μου πάντα ήθελαν έναν γιατρό στην οικογένεια. Ωστόσο, είμαι κακός στο να ακολουθώ τις οδηγίες και έγινα το λάθος είδος γιατρού! Εμπνευσμένος από τα μαθήματα φυσικής και πληροφορικής στο γυμνάσιο, αποφάσισα να σπουδάσω μηχανικός. Ήθελα να βοηθήσω όσο περισσότερους ανθρώπους μπορούσε ένας γιατρός.

Στο MIT, έψαξα για εφαρμογές στην ενέργεια, την εκπαίδευση και τη γεωργία, αλλά το αυτοοδηγούμενο αυτοκίνητο ήταν το πρώτο που με άρπαξε. Δεν έχει ακόμη αφεθεί! Το ενενήντα τέσσερα τοις εκατό των σοβαρών τροχαίων ατυχημάτων προκαλούνται από ανθρώπινο λάθος και θα μπορούσαν ενδεχομένως να αποφευχθούν από αυτοοδηγούμενα αυτοκίνητα. Τα αυτόνομα οχήματα θα μπορούσαν επίσης να μειώσουν την κυκλοφοριακή συμφόρηση, να εξοικονομήσουν ενέργεια και να βελτιώσουν την κινητικότητα.

Πρώτα έμαθα για τα αυτοοδηγούμενα αυτοκίνητα από Σεθ Τέλερ κατά τη διάρκεια της προσκεκλημένης διάλεξής του για το μάθημα Mobile Autonomous Systems Lab (MASLAB), στο οποίο οι προπτυχιακοί φοιτητές του MIT διαγωνίζονται για την κατασκευή του καλύτερου πλήρως λειτουργικού ρομπότ από την αρχή. Το ρομπότ μας που φέρνει μπάλα, Γύψος, κατέκτησε την πρώτη θέση. Από εκεί, παρακολούθησα περισσότερα μαθήματα μηχανικής μάθησης, όρασης υπολογιστών και μεταφοράς και μπήκα στο εργαστήριο του Teller. Συμμετείχα επίσης σε πολλά hackathon που σχετίζονται με την κινητικότητα, συμπεριλαμβανομένου ενός που χορηγείται από το Hubway, γνωστό πλέον ως Blue Bike.

Ε: Εξερευνήσατε τρόπους για να βοηθήσετε τους ανθρώπους και τα αυτόνομα οχήματα να αλληλεπιδρούν πιο ομαλά. Τι κάνει αυτό το πρόβλημα τόσο δύσκολο;

ΕΝΑ: Και τα δύο συστήματα είναι πολύ περίπλοκα και τα κλασικά μας εργαλεία μοντελοποίησης είναι θλιβερά ανεπαρκή. Η ενσωμάτωση αυτόνομων οχημάτων στα υπάρχοντα συστήματα κινητικότητας είναι ένα τεράστιο εγχείρημα. Για παράδειγμα, δεν γνωρίζουμε εάν τα αυτόνομα οχήματα θα μειώσουν τη χρήση ενέργειας κατά 40 τοις εκατό ή θα τη διπλασιάσουν. Χρειαζόμαστε πιο ισχυρά εργαλεία για να ξεπεράσουμε την αβεβαιότητα. Μου διδακτορική διατριβή στο Μπέρκλεϋ προσπάθησε να το κάνει αυτό. Ανέπτυξα κλιμακούμενες μεθόδους βελτιστοποίησης στους τομείς του ελέγχου ρομπότ, της εκτίμησης κατάστασης και του σχεδιασμού του συστήματος. Αυτές οι μέθοδοι θα μπορούσαν να βοηθήσουν τους υπεύθυνους λήψης αποφάσεων να προβλέψουν μελλοντικά σενάρια και να σχεδιάσουν καλύτερα συστήματα για να φιλοξενήσουν ανθρώπους και ρομπότ.

Ε: Πώς αλλάζει η ρομποτική η βαθιά ενισχυτική μάθηση, ο συνδυασμός αλγορίθμων βαθιάς και ενισχυτικής μάθησης;

ΕΝΑ: Παρακολούθησα το μάθημα ενισχυτικής μάθησης των John Schulman και Pieter Abbeel στο Μπέρκλεϋ το 2015, λίγο μετά τη δημοσίευση της πρωτοποριακής τους εργασίας στο Deepmind Φύση. Είχαν εκπαιδεύσει έναν πράκτορα μέσω της βαθιάς μάθησης και της ενισχυτικής μάθησης να παίζει το “Space Invaders” και μια σουίτα παιχνιδιών Atari σε υπεράνθρωπα επίπεδα. Αυτό δημιούργησε αρκετό θόρυβο. Ένα χρόνο αργότερα, άρχισα να ενσωματώνω την ενισχυτική μάθηση σε προβλήματα που αφορούν συστήματα μικτής κυκλοφορίας, στα οποία μόνο ορισμένα αυτοκίνητα είναι αυτοματοποιημένα. Συνειδητοποίησα ότι οι κλασσικές τεχνικές ελέγχου δεν μπορούσαν να χειριστούν τα πολύπλοκα μη γραμμικά προβλήματα ελέγχου που διατύπωνα.

Το Deep RL είναι πλέον mainstream, αλλά σε καμία περίπτωση δεν είναι διάχυτο στη ρομποτική, η οποία εξακολουθεί να βασίζεται σε μεγάλο βαθμό σε κλασικές μεθόδους ελέγχου και σχεδιασμού που βασίζονται σε μοντέλα. Η βαθιά μάθηση συνεχίζει να είναι σημαντική για την επεξεργασία ακατέργαστων δεδομένων αισθητήρων, όπως εικόνες κάμερας και ραδιοκύματα, και η ενισχυτική μάθηση ενσωματώνεται σταδιακά. Βλέπω τα συστήματα κυκλοφορίας ως γιγάντια συστήματα πολλαπλών ρομπότ. Είμαι ενθουσιασμένος για μια επικείμενη συνεργασία με το Τμήμα Μεταφορών της Γιούτα για την εφαρμογή ενισχυτικής εκμάθησης για τον συντονισμό των αυτοκινήτων με τα σήματα κυκλοφορίας, μειώνοντας τη συμφόρηση και συνεπώς τις εκπομπές άνθρακα.

Ε: Έχετε μιλήσει για το μάθημα του MIT, 6.007 (Σήματα και Συστήματα), και τον αντίκτυπό του σε εσάς. Τι σου μίλησε;

ΕΝΑ: Η νοοτροπία. Τα προβλήματα που φαίνονται ακατάστατα μπορούν να αναλυθούν με κοινά, και μερικές φορές απλά, εργαλεία. Τα σήματα μετασχηματίζονται από τα συστήματα με διάφορους τρόπους, αλλά τι σημαίνουν αυτοί οι αφηρημένοι όροι; Ένα μηχανικό σύστημα μπορεί να λάβει ένα σήμα όπως γρανάζια που στρίβουν με κάποια ταχύτητα και να το μετατρέψει σε μοχλό που στρίβει με άλλη ταχύτητα. Ένα ψηφιακό σύστημα μπορεί να πάρει δυαδικά ψηφία και να τα μετατρέψει σε άλλα δυαδικά ψηφία ή μια σειρά από γράμματα ή μια εικόνα. Τα χρηματοπιστωτικά συστήματα μπορούν να λαμβάνουν νέα και να τα μεταμορφώνουν μέσω εκατομμυρίων συναλλαγών σε τιμές μετοχών. Οι άνθρωποι λαμβάνουν σήματα καθημερινά μέσω διαφημίσεων, προσφορών εργασίας, κουτσομπολιά και ούτω καθεξής, και τα μεταφράζουν σε ενέργειες που με τη σειρά τους επηρεάζουν την κοινωνία και τους άλλους ανθρώπους. Αυτή η ταπεινή τάξη σημάτων και συστημάτων συνέδεσε μηχανικά, ψηφιακά και κοινωνικά συστήματα και μου έδειξε πώς τα βασικά εργαλεία μπορούν να μειώσουν τον θόρυβο.

Ε: Στο έργο σας με την Amazon εκπαιδεύετε ρομπότ αποθήκης να παραλαμβάνουν, να ταξινομούν και να παραδίδουν αγαθά. Ποιες είναι οι τεχνικές προκλήσεις;

ΕΝΑ: Αυτό το έργο περιλαμβάνει την ανάθεση ρομπότ σε μια δεδομένη εργασία και τη δρομολόγηση τους εκεί. [Professor] Η ομάδα της Cynthia Barnhart επικεντρώνεται στην ανάθεση εργασιών και η δική μου στον σχεδιασμό διαδρομής. Και τα δύο προβλήματα θεωρούνται προβλήματα συνδυαστικής βελτιστοποίησης επειδή η λύση περιλαμβάνει έναν συνδυασμό επιλογών. Καθώς ο αριθμός των εργασιών και των ρομπότ αυξάνεται, ο αριθμός των πιθανών λύσεων αυξάνεται εκθετικά. Λέγεται κατάρα της διάστασης. Και τα δύο προβλήματα είναι αυτό που ονομάζουμε NP Hard. μπορεί να μην υπάρχει αποτελεσματικός αλγόριθμος για την επίλυσή τους. Στόχος μας είναι να επινοήσουμε μια συντόμευση.

Η δρομολόγηση ενός ρομπότ για μία μόνο εργασία δεν είναι δύσκολη. Είναι σαν να χρησιμοποιείτε τους Χάρτες Google για να βρείτε τη συντομότερη διαδρομή για το σπίτι. Μπορεί να λυθεί αποτελεσματικά με πολλούς αλγόριθμους, συμπεριλαμβανομένου του Dijkstra. Όμως οι αποθήκες μοιάζουν με μικρές πόλεις με εκατοντάδες ρομπότ. Όταν εμφανίζονται μποτιλιαρίσματα, οι πελάτες δεν μπορούν να πάρουν τα πακέτα τους τόσο γρήγορα. Στόχος μας είναι να αναπτύξουμε αλγόριθμους που βρίσκουν τα πιο αποτελεσματικά μονοπάτια για όλα τα ρομπότ.

Ε: Υπάρχουν άλλες εφαρμογές;

ΕΝΑ: Ναί. Οι αλγόριθμοι που δοκιμάζουμε στις αποθήκες του Amazon μπορεί μια μέρα να βοηθήσουν στη μείωση της συμφόρησης σε πραγματικές πόλεις. Άλλες πιθανές εφαρμογές περιλαμβάνουν τον έλεγχο αεροπλάνων σε διαδρόμους, σμήνη drones στον αέρα, ακόμη και χαρακτήρες σε βιντεοπαιχνίδια. Αυτοί οι αλγόριθμοι θα μπορούσαν επίσης να χρησιμοποιηθούν για άλλες εργασίες ρομποτικού σχεδιασμού, όπως ο προγραμματισμός και η δρομολόγηση.

Ε: Το AI εξελίσσεται ραγδαία. Πού ελπίζετε να δείτε τις μεγάλες ανακαλύψεις να έρχονται;

ΕΝΑ: Θα ήθελα να δω τη βαθιά μάθηση και το βαθύ RL να χρησιμοποιούνται για την επίλυση κοινωνικών προβλημάτων που αφορούν την κινητικότητα, τις υποδομές, τα μέσα κοινωνικής δικτύωσης, την υγειονομική περίθαλψη και την εκπαίδευση. Η Deep RL έχει πλέον σημαντική θέση στη ρομποτική και βιομηχανικές εφαρμογές όπως σχεδιασμός τσιπ, αλλά πρέπει ακόμα να είμαστε προσεκτικοί στην εφαρμογή του σε συστήματα με ανθρώπους στο βρόχο. Τελικά, θέλουμε να σχεδιάσουμε συστήματα για ανθρώπους. Επί του παρόντος, απλά δεν έχουμε τα κατάλληλα εργαλεία.

Ε: Τι σας ανησυχεί περισσότερο όταν η τεχνητή νοημοσύνη αναλαμβάνει όλο και πιο εξειδικευμένες εργασίες;

ΕΝΑ: Η τεχνητή νοημοσύνη έχει τη δυνατότητα για τρομερά καλά, αλλά θα μπορούσε επίσης να βοηθήσει στην επιτάχυνση του διευρυνόμενου χάσματος μεταξύ των εχόντων και των μη εχόντων. Τα πολιτικά και ρυθμιστικά μας συστήματα θα μπορούσαν να βοηθήσουν στην ενσωμάτωση της τεχνητής νοημοσύνης στην κοινωνία και στην ελαχιστοποίηση των απωλειών θέσεων εργασίας και της εισοδηματικής ανισότητας, αλλά ανησυχώ ότι δεν είναι ακόμη εξοπλισμένα για να χειριστούν την τεχνητή νοημοσύνη.

Ε: Ποιο είναι το τελευταίο υπέροχο βιβλίο που διαβάσατε;

ΕΝΑ:Πώς να αποφύγετε μια κλιματική καταστροφή», του Μπιλ Γκέιτς. Μου άρεσε πολύ ο τρόπος με τον οποίο ο Γκέιτς μπόρεσε να πάρει ένα εξαιρετικά περίπλοκο θέμα και να το μετατρέψει σε λέξεις που ο καθένας μπορούσε να καταλάβει. Η αισιοδοξία του με εμπνέει να συνεχίσω να πιέζω για εφαρμογές τεχνητής νοημοσύνης και ρομποτικής για να αποφύγω μια κλιματική καταστροφή.


Ειδήσεις MIT



Source link

By koutsobolis

koutsobolis.com

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται.