Acing the Data Science Συνέντευξη - Μέρος 2

Έγραψα για την προετοιμασία της συνέντευξης για την επιστήμη δεδομένων - Μέρος 1 την περασμένη εβδομάδα.

Αυτό το άρθρο αποτελεί συνέχεια και συμπέρασμα αυτού του θέματος. Προηγουμένως, έχω γράψει άρθρα σχετικά με ερωτήσεις συνέντευξης AI για ορισμένες κορυφαίες εταιρείες σε αυτόν τον τομέα. Με βάση την ομόφωνη γνώμη σχετικά με αυτά τα άρθρα από τους αναγνώστες, φαίνεται ότι υπήρχε μια φυσική συνέχεια ως προς τον τρόπο προετοιμασίας για αυτές τις συνεντεύξεις. Προκειμένου να καλύψω περιεκτικά αυτό το μεγάλο θέμα, το χώρισα σε μέρη. Αυτό είναι το Μέρος 2.

Τα επόμενα βήματα είναι βαθύτερα στον κόσμο της τεχνητής νοημοσύνης και θα απαιτήσουν περισσότερη προσπάθεια και σε βάθος μάθηση. Θα πρέπει να σημειωθεί ότι τα επόμενα βήματα θα πρέπει να προετοιμάζονται ανάλογα με τις ανάγκες, με βάση τις εταιρικές κατηγορίες κάθετων και το Data Science stack.

Στοίβα εκμάθησης AI

Βήματα 1-4: Βήματα για να συνεντεύξουμε τη συνέντευξη AI - Μέρος 1

5. Πιθανότητα - Μοντέλα παλινδρόμησης (Στατιστικά - 2 ημέρες):

Πιθανότητα είναι η πιθανότητα να συμβεί ένα συμβάν. Πιθανόν κάποιος να αγοράσει το προϊόν online, να κάνει κλικ στον σύνδεσμο ή να χρησιμοποιήσει μια λειτουργία. Όλα τα προβλήματα που μπορεί να λύσει η AI, θα είναι πάντα σε κάποια πιθανότητα βάσης. Αποτελεί τη βάση της λογικής που απαιτείται για τη δημιουργία των αλγορίθμων που καταναλώνουν τα δεδομένα.

Μεγάλο μέρος αυτού του πεδίου προετοιμάζει διαφορετικά μοντέλα για να ταιριάζουν στα δεδομένα ή να συμπεράνουν από αυτά. Η γραμμική παλινδρόμηση, η λογιστική παλινδρόμηση, η κάθοδος κλίσης είναι μερικά από τα μοντέλα. Αυτά τα μοντέλα διδάσκονται στα περισσότερα βασικά μαθήματα επιστήμης υπολογιστών / μαθηματικών. Αυτά είναι πολύ σημαντικά καθώς η επιλογή ενός μοντέλου θα σας βοηθήσει να προβλέψετε πού θα πάνε τα δεδομένα σας ή τι θα συμβεί στη συνέχεια.

Σημαντική ανάγνωση που θα χρησιμοποιούσα:

  • Πρακτικές συστάσεις για την κατάρτιση βαθιάς αρχιτεκτονικής με βάση την κλίση: https: //arxiv.org/abs/1206.5533
  • Online Στατιστικό Βιβλίο (Ενότητα Πιθανοτήτων): Πιθανότητα Deep Dive
  • Μια γρήγορη ανάγνωση στα μοντέλα παλινδρόμησης: πολλαπλή παλινδρόμηση

6. Βασικά στοιχεία μηχανικής μάθησης (Υπολογισμός - 4 ημέρες):

Η μηχανική εκμάθηση χρησιμοποιείται από την πρόβλεψη της συμπεριφοράς των χρηστών έως την αυτο-οδήγηση αυτοκινήτων και οτιδήποτε ενδιάμεσα. Η διασταύρωση φθηνής υπολογιστικής ισχύος σε συνδυασμό με φθηνή αποθήκευση δεδομένων έχει οδηγήσει στην άνθηση αυτού του πεδίου. Είναι ένα τεράστιο πεδίο από μόνη της και απαιτεί βαθιές καταδύσεις ανά κλίση και ικανότητες του ατόμου. Τα βασικά πρέπει να περιλαμβάνουν το Tensorflow (από την Google), το Scikit Learn που είναι API που βασίζονται στην Python ειδικά σχεδιασμένη για προβλήματα που σχετίζονται με AI / ML.

Σημαντική ανάγνωση για προετοιμασία:

  • Αλγόριθμοι μηχανικής εκμάθησης (Λίστα των σημαντικών αλγορίθμων): Αλγόριθμοι ML
  • Backdrop (Τεχνική Backdrop σε ML): Κατανόηση του Backdrop από τον Andrej Karpathy
  • Εκπαιδευτικά σεμινάρια για TensorFlow: Tensorflow Tutorials

7. Advanced ML (Πληροφορική - 3 ημέρες)

Το Advanced ML περιλαμβάνει διάφορους αλγόριθμους και τεχνικές για την αντιμετώπιση πολύπλοκων προβλημάτων δεδομένων. Τα δεδομένα Time Series μπορεί να είναι περίπλοκα για να ταιριάζουν σε ένα παραδοσιακό μοντέλο ML. Ως εκ τούτου, τα δίκτυα LSTM - Μακροπρόθεσμης Μνήμης χρησιμοποιούνται για την αντιμετώπιση αυτού του ζητήματος.

Σημαντική ανάγνωση για προετοιμασία:

  • LSTM (ευκολότερος τρόπος κατανόησης των LSTM): Κατανόηση των LSTM
  • Παράδειγμα πραγματικής ζωής Kaggle για Time Series: Machine Learning για ανάλυση Time Series
  • Advanced ML (Παρουσίαση του Πανεπιστημίου των Βρυξελλών): Στρατηγικές μηχανικής μάθησης για πρόβλεψη χρονοσειρών

8. Πραγματικός κόσμος / Μη δομημένη επεξεργασία δεδομένων (Υπολογισμός - 3 ημέρες)

Το επίτευγμα βαθιάς μάθησης της Google με την αναγνώριση ομιλίας είναι γνωστό. Έχουν χρησιμοποιήσει Recurrent Neural Networks (RNNs) για να επιτύχουν αυτόν τον στόχο. Το δίκτυο δεν διαθέτει αρκετές πληροφορίες για να προχωρήσει καθώς τα δεδομένα δεν είναι δομημένα και ως εκ τούτου, συμπεριλαμβάνουμε πληροφορίες σχετικά με την ακολουθία χαρακτήρων ή δεδομένων και τα τροφοδοτούμε στο δίκτυο. Αυτό το είδος RNNs είναι κατάλληλο για αναγνώριση ομιλίας. Αυτός είναι επίσης ένας τεράστιος τομέας έρευνας και το εύρος και το βάθος εξαρτάται από το άτομο και την εταιρεία στην οποία παίρνει συνέντευξη.

Σημαντική ανάγνωση για προετοιμασία:

  • Πρακτικός οδηγός για τη χρήση RNN: Πρόβλεψη χρονοσειρών με χρήση RNN
  • Κατανόηση της τεχνικής της οπίσθιας διάδοσης: Τάξη διάδοσης του Στάνφορντ

Σύνολα δεδομένων για έρευνα AI / ML / DS: Πλήρης λίστα

Μόλις φτάσετε μέχρι τώρα, ο παραπάνω σύνδεσμος μπορεί να χρησιμοποιηθεί για την κατανάλωση δεδομένων και για εξοικείωση με το μέγεθος και το είδος της εργασίας, κάνουν οι επιστήμονες δεδομένων. Η πρακτική γνώση δεν χάνεται ποτέ.

9. Βαθιά μάθηση - Νευρωνικό δίκτυο (Πληροφορική - 3 ημέρες)

Η βαθιά μάθηση επικαλύπτεται με ML με πολλούς τρόπους. Περιλαμβάνει έννοιες όπως GANs (Generative Adversarial Networks) και ημι-εποπτευόμενη μάθηση. CNN ή συνελικτικά νευρικά δίκτυα χρησιμοποιούνται για την αναγνώριση και την ταξινόμηση εικόνας. Αυτή η περιοχή έχει εκτεταμένες επιπτώσεις στο τρέχον τεχνολογικό οικοσύστημα. Ανάλογα με την εταιρεία, η χρήση του μπορεί να διαφέρει από τη δημιουργία βίντεο έως την ταξινόμηση εικόνας. Ως εκ τούτου, ανάλογα με την εταιρεία, αυτός ο τομέας θα πρέπει να είναι προετοιμασμένος λαμβάνοντας υπόψη το είδος των ερωτήσεων που μπορεί να προκύψουν.

Σημαντική ανάγνωση που θα χρησιμοποιούσα:

  • Convolutional Neural Networks: CS-231 (Stanford Class Notes)
  • Βαθιά μάθηση (Βιβλίο): http://neuralnetworksanddeeplearning.com/
  • Advanced Deep Learning (Βιβλίο): https://www.deeplearningbook.org/

Αυτό ολοκληρώνει την προετοιμασία για μια συνέντευξη AI / ML / DS. Η προετοιμασία θα ποικίλει ανάλογα με το πού το άτομο πλησιάζει το πεδίο. Ο χρόνος προετοιμασίας για τους ερευνητές θα διαφέρει από μηχανικούς δεδομένων σε φυσιολογικούς μηχανικούς πληροφορικής. Η προετοιμασία θα πρέπει να διαρκέσει περίπου 20–22 ημέρες ανάλογα με τις υπάρχουσες γνώσεις του ατόμου, τους χρονικούς περιορισμούς και τις συγκεκριμένες απαιτήσεις της εταιρείας.

Προετοιμασία για μια συνέντευξη AI - Μέρος 1: Βήματα για τον Ace the AI ​​Interview - Μέρος 1

Εγγραφείτε στο ενημερωτικό μας δελτίο του Acing AI, υπόσχομαι να μην ανεβάζω spam και ΔΩΡΕΑΝ!

Ευχαριστώ για την ανάγνωση! Αν σας άρεσε, δοκιμάστε πόσες φορές μπορείτε να χτυπήσετε σε 5 δευτερόλεπτα. Είναι υπέροχο καρδιο για τα δάχτυλά σας ΚΑΙ θα βοηθήσει άλλους ανθρώπους να δουν την ιστορία.