Συνέντευξη με τους Huy Ha και Shuran Song: CoRL 2021 βραβείο καλύτερου συστήματος χαρτιού


Συγχαρητήρια σε Huy Ha και Τραγούδι Σουράν που έχουν κερδίσει το Βραβείο καλύτερου χαρτιού συστήματος CoRL 2021!

Η δουλειά τους, FlingBot: η παράλογη αποτελεσματικότητα των δυναμικών χειρισμών για το ξεδίπλωμα του υφάσματος, εγκωμιάστηκε από την κριτική επιτροπή. «Για μένα, αυτή η εργασία αποτελεί την πιο εντυπωσιακή περιγραφή τόσο της προσομοίωσης όσο και της πραγματικής χειραγώγησης υφασμάτων μέχρι σήμερα.», σχολίασε ένας από τους κριτικούς.

Παρακάτω, οι συγγραφείς μας λένε περισσότερα για τη δουλειά τους, τη μεθοδολογία και τι σχεδιάζουν στη συνέχεια.

Ποιο είναι το θέμα της έρευνας στην εργασία σας;

Στην πιο πρόσφατη δημοσίευσή μου με τον σύμβουλό μου, τον καθηγητή Shuran Song, μελετήσαμε το έργο του ξεδιπλώματος του υφάσματος. Ο στόχος της εργασίας είναι ο χειρισμός ενός υφάσματος από μια τσαλακωμένη αρχική κατάσταση σε μια κατάσταση ξεδίπλωσης, κάτι που ισοδυναμεί με τη μεγιστοποίηση της κάλυψης του υφάσματος στο χώρο εργασίας.

Θα μπορούσατε να μας πείτε για τις επιπτώσεις της έρευνάς σας και γιατί είναι ένας ενδιαφέρον τομέας για μελέτη;

Ιστορικά, τα περισσότερα ερευνητικά θέματα ρομποτικής χειραγώγησης, όπως ο σχεδιασμός αντιλήψεων, αφορούν άκαμπτα αντικείμενα, τα οποία έχουν μόνο 6 βαθμούς ελευθερίας, καθώς η γεωμετρία τους δεν αλλάζει. Αυτό επιτρέπει σε κάποιον να εφαρμόσει την τυπική εκτίμηση κατάστασης – αγωγός σχεδιασμού εργασιών και κίνησης στη ρομποτική. Αντίθετα, τα παραμορφώσιμα αντικείμενα θα μπορούσαν να λυγίσουν και να τεντωθούν σε αυθαίρετες κατευθύνσεις, οδηγώντας σε άπειρους βαθμούς ελευθερίας. Δεν είναι σαφές ποια θα πρέπει να είναι η κατάσταση του υφάσματος. Επιπλέον, παραμορφώσιμα αντικείμενα, όπως τα ρούχα, θα μπορούσαν να παρουσιάσουν σοβαρή απόφραξη του εαυτού τους – δεδομένου ότι ένα τσαλακωμένο κομμάτι ύφασμα, είναι δύσκολο να προσδιορίσετε εάν πρόκειται για πουκάμισο, σακάκι ή παντελόνι. Επομένως, το ξεδίπλωμα του υφάσματος είναι ένα τυπικό πρώτο βήμα των σωληνώσεων χειρισμού υφασμάτων, καθώς αποκαλύπτει βασικά χαρακτηριστικά του υφάσματος για αντίληψη και χειρισμό κατάντη.

Παρά την αφθονία των εξελιγμένων μεθόδων για το ξετύλιγμα του υφάσματος με την πάροδο των ετών, συνήθως αντιμετωπίζουν μόνο την εύκολη υπόθεση (όπου το ύφασμα ξεκινά ήδη ως επί το πλείστον ξεδιπλωμένο) ή κάνουν πάνω από εκατό βήματα για δύσκολες θήκες. Αυτές οι προηγούμενες εργασίες χρησιμοποιούν όλες οιονεί στατικές ενέργειες ενός βραχίονα, όπως επιλογή και τοποθέτηση, η οποία είναι αργή και περιορισμένη από το εύρος της φυσικής εμβέλειας του συστήματος.

Θα μπορούσατε να εξηγήσετε τη μεθοδολογία σας;

Στην καθημερινή μας ζωή, οι άνθρωποι συνήθως χρησιμοποιούν και τα δύο χέρια για να χειριστούν τα υφάσματα και με ένα ή δύο πέταγμα υψηλής ταχύτητας, μπορούμε να ξεδιπλώσουμε ένα αρχικά τσαλακωμένο ύφασμα. Με βάση αυτή την παρατήρηση, η βασική μας ιδέα είναι απλή: Χρησιμοποιήστε δυναμικές ενέργειες διπλού βραχίονα για το ξεδίπλωμα του υφάσματος.

Το FlingBot είναι ένα αυτο-εποπτευόμενο πλαίσιο για ξεδίπλωμα υφάσματος το οποίο χρησιμοποιεί πρωτόγονο pick, stretch και fling primitive για ρύθμιση διπλού βραχίονα από οπτικές παρατηρήσεις. Υπάρχουν τρία βασικά στοιχεία της προσέγγισής μας. Πρώτα είναι η απόφαση να χρησιμοποιήσετε μια δυναμική δράση υψηλής ταχύτητας. Βασιζόμενη στη μάζα των υφασμάτων σε συνδυασμό με μια ρίψη υψηλής ταχύτητας για να κάνει το μεγαλύτερο μέρος της δουλειάς της, μια δυναμική πολιτική πετάγματος μπορεί να ξεδιπλώσει τα υφάσματα πολύ πιο αποτελεσματικά από μια οιονεί στατική πολιτική. Το δεύτερο είναι η παραμετροποίηση λαβής διπλού βραχίονα που καθιστά εύκολους τους ικανοποιητικούς περιορισμούς ασφάλειας σύγκρουσης. Αντιμετωπίζοντας μια λαβή με διπλό βραχίονα όχι ως δύο σημεία αλλά ως μια γραμμή με περιστροφή και μήκος, μπορούμε να περιορίσουμε άμεσα την περιστροφή και το μήκος της γραμμής για να διασφαλίσουμε ότι οι βραχίονες δεν σταυρώνουν ο ένας τον άλλο και δεν προσπαθούν να πιάσουν πολύ κοντά ο ένας τον άλλον. Τρίτον είναι η επιλογή μας να χρησιμοποιήσουμε τους Χάρτες Χωρικής Δράσης, οι οποίοι μαθαίνουν μεταφραστικούς, περιστροφικούς και ισοδύναμους χάρτες κλίμακας και επιτρέπουν την αποτελεσματική μάθηση δειγμάτων.

Ποια ήταν τα κύρια ευρήματά σας;

Βρήκαμε ότι οι δυναμικές ενέργειες έχουν τρεις επιθυμητές ιδιότητες έναντι των οιονεί στατικών ενεργειών για την εργασία του ξεδιπλώματος του υφάσματος. Πρώτον, είναι αποτελεσματικά – το FlingBot επιτυγχάνει πάνω από 80% κάλυψη με 3 ενέργειες σε νέα υφάσματα. Δεύτερον, είναι γενικεύσιμα – εκπαιδευμένα μόνο σε τετράγωνα υφάσματα, το FlingBot γενικεύει και στα μπλουζάκια. Τρίτον, επεκτείνουν το εύρος αποτελεσματικής προσέγγισης του συστήματος – ακόμα και όταν το FlingBot δεν μπορεί να σηκώσει ή να τεντώσει πλήρως ένα ύφασμα μεγαλύτερο από το εύρος φυσικής προσέγγισης του συστήματος, μπορεί να χρησιμοποιήσει πτερύγια υψηλής ταχύτητας για να ξεδιπλώσει το ύφασμα.

Μετά την εκπαίδευση και την αξιολόγηση του μοντέλου μας στην προσομοίωση, αναπτύξαμε και βελτιστοποιήσαμε το μοντέλο μας σε ένα πραγματικό σύστημα διπλού βραχίονα, το οποίο επιτυγχάνει κάλυψη άνω του 80% για όλες τις κατηγορίες υφασμάτων. Εν τω μεταξύ, η σχεδόν στατική γραμμή βάσης επιλογής και θέσης ήταν σε θέση να επιτύχει μόνο περίπου 40% κάλυψη.

Τι περαιτέρω εργασίες σχεδιάζετε σε αυτόν τον τομέα;

Αν και παρακινήσαμε το ξεδίπλωμα του υφάσματος ως πρόδρομο για κατάντη ενότητες όπως η εκτίμηση κατάστασης υφάσματος, το ξεδίπλωμα θα μπορούσε επίσης να ωφεληθεί από την εκτίμηση κατάστασης. Για παράδειγμα, εάν το σύστημα είναι βέβαιο ότι έχει αναγνωρίσει τους ώμους του πουκάμισου στην εκτίμηση της κατάστασης του, η πολιτική ξεδιπλώματος θα μπορούσε να πιάσει απευθείας τους ώμους και να ξεδιπλώσει το πουκάμισο σε ένα βήμα. Με βάση αυτή την παρατήρηση, εργαζόμαστε επί του παρόντος σε μια προσέγγιση ξεδιπλώματος υφάσματος και εκτίμησης κατάστασης που μπορεί να μάθει με αυτοεποπτευόμενο τρόπο στον πραγματικό κόσμο.


Σχετικά με τους συγγραφείς

Huy Ha είναι Ph.D. φοιτητής στην Επιστήμη Υπολογιστών στο Πανεπιστήμιο Κολούμπια. Συμβουλεύεται από τον καθηγητή Shuran Song και είναι μέλος του εργαστηρίου Τεχνητής Νοημοσύνης και Ρομποτικής της Κολούμπια (CAIR).

Τραγούδι Σουράν είναι επίκουρη καθηγήτρια στο τμήμα επιστήμης υπολογιστών στο Πανεπιστήμιο Κολούμπια, όπου διευθύνει το Εργαστήριο Τεχνητής Νοημοσύνης και Ρομποτικής (CAIR) της Κολούμπια. Η έρευνά της επικεντρώνεται στην όραση υπολογιστών και τη ρομποτική. Ενδιαφέρεται για την ανάπτυξη αλγορίθμων που επιτρέπουν στα ευφυή συστήματα να μαθαίνουν από τις αλληλεπιδράσεις τους με τον φυσικό κόσμο και να αποκτούν αυτόνομα τις δεξιότητες αντίληψης και χειραγώγησης που είναι απαραίτητες για την εκτέλεση σύνθετων εργασιών και την παροχή βοήθειας στους ανθρώπους.


Μάθετε περισσότερα

  • Διαβάστε την εφημερίδα στο arXiv.
  • Τα βίντεο των πειραμάτων και ο κώδικας στον πραγματικό κόσμο είναι διαθέσιμα εδώ, όπως είναι ένα βίντεο από την παρουσίαση των συγγραφέων στο CoRL.
  • Διαβάστε περισσότερα σχετικά με τις νικητήριες και τις επιλεγμένες εργασίες για τα βραβεία CoRL εδώ.

ετικέτες: ,



Daniel Carrillo-Zapata
Γνώρισε το διδακτορικό του στη ρομποτική σμήνος στο Bristol Robotics Lab το 2020. Τώρα καλλιεργεί την κουλτούρα της «επιστημονικής διέγερσης» για να συμμετάσχει σε αμφίδρομες συνομιλίες μεταξύ ερευνητών και κοινωνίας.

Ο Daniel Carrillo-Zapata έλαβε το διδακτορικό του στη ρομποτική σμήνος στο Bristol Robotics Lab το 2020. Τώρα καλλιεργεί την κουλτούρα της «επιστημονικής διέγερσης» για να συμμετέχει σε αμφίδρομες συνομιλίες μεταξύ ερευνητών και κοινωνίας.



Source link

By koutsobolis

koutsobolis.com

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *