5 Cara Melarikan Diri dari Kebiasaan Ilmu Data

Buka blokir pengembangan Anda dengan ide-ide yang berkembang ini

 

Perkenalan

Kita semua tahu bagaimana rasanya berada dalam kebiasaan. Suatu hari, Anda merasa seperti akan mempelajari sesuatu yang baru, memulai proyek baru, dan terjun langsung ke dunia ilmu data –  keesokan harinya, Anda hanya merasa seperti sedang melakukan gerakan. Setelah beberapa saat, Anda tampaknya tidak berjuang menuju tujuan Anda, hanya menghabiskan waktu atau berlari melalui pekerjaan ekstra tanpa henti.

Ketika kita menemukan diri kita berputar-putar seperti ini, penting untuk memeriksa rutinitas kita dan menemukan cara baru untuk membuat segalanya menyenangkan lagi. Berikut adalah lima ide untuk membantu Anda keluar dari kemerosotan kreatif dan jatuh cinta dengan ilmu data lagi.

 

1.  Lakukan pelatihan silang dalam ilmu data

Saya baru-baru ini membaca sebuah artikel tentang kepemimpinan, dan poin utamanya adalah bahwa dalam hal meningkatkan kekuatan, latihan silang lebih baik daripada menggandakan kardio.

Inovasi inovatif dalam pembelajaran mesin berasal dari pelatihan silang. Mengambil model transformator gambar sebagai contoh, model visi komputer  (CV) canggih ini (yang melampaui  CNN) pada awalnya adalah pemrosesan bahasa alami (NLP)  Ini sangat didasarkan pada model yang dirancang untuk: Pelatihan silang ilmu data tidak terbatas pada menjembatani disiplin ilmu seperti CV ke NLP, tetapi juga mencakup domain. Transformers of Attention Is All You Need yang asli melakukan terjemahan bahasa. Saat ini, model transformator diterapkan pada segala hal mulai dari segmentasi gambar medis hingga pengenalan suara.

Apakah Anda merasa terjebak? Lakukan latihan silang Anda sendiri. Jika spesialisasi Anda adalah pembelajaran yang diawasi, periksa teknik pembelajaran penguatan dan lihat apa yang dapat Anda pelajari. Atau, jika Anda tertarik dengan deteksi objek untuk pengenalan wajah, lihat apa yang dapat Anda pelajari dari penelitian deteksi objek dalam pembelajaran mesin medis.

 

2. Kumpulkan dan visualisasikan data Anda sendiri

Visualisasi data adalah keterampilan penting untuk diletakkan di sabuk alat Anda. Baik Anda menggunakan visualisasi data sebagai alat eksplorasi sebelum pemodelan, atau membuat visualisasi interaktif yang menyampaikan cerita data, visualisasi yang menyampaikan informasi dengan jelas dan efektif sangat penting.

Salah satu cara favorit saya untuk mengasah keterampilan visualisasi data Anda adalah dengan mengumpulkan data Anda sendiri, membuat sketsa beberapa visualisasi, dan kemudian melihat bagaimana Anda dapat menerapkannya menggunakan alat visualisasi data. Pertama, putar otak Anda untuk pertanyaan yang selalu ingin Anda jawab.  Seberapa sering anjing tetangga  Anda menggonggong per minggu dan berapa kali sehari Anda memeriksa email Anda? Berapa banyak mobil putih yang melewati jendela melawan mobil hitam? Dunia adalah tiram Anda!

 

Selanjutnya, mulailah mengumpulkan data. Dengan mengumpulkan data Anda sendiri tanpa menggunakan data terbuka secara online, Anda memiliki kontrol kreatif penuh atas apa yang kami kumpulkan dan seberapa sering kami mengumpulkannya. Juga mudah untuk melihat aspek mana dari himpunan data yang menarik untuk divisualisasikan saat Anda membuatnya sendiri. Setelah Anda memiliki data, gunakan pena dan kertas untuk membuat sketsa beberapa visualisasi potensial. Kuantitas di atas kualitas di sini –  cukup atur timer menjadi sekitar 5 menit dan dapatkan banyak sketsa di atas kertas. Pada akhirnya, habiskan 1 ~2 jam untuk mengkodekan visualisasi favorit Anda. Jika Anda mencari inspirasi sebelum mulai membuat sketsa, saya sarankan Anda memeriksa kompleksitas visual dan “informasi itu indah” dan melihat banyak ilustrasi menarik.

 

3. Pelajari metode ilmu data dari prinsip pertama

Mempelajari metode ilmu data dari prinsip pertama adalah cara yang bagus untuk mengasah keterampilan matematika dan statistik Anda sambil keluar dari kebiasaan itu. Publikasi seperti Towards Data Science adalah tempat yang tepat untuk menemukan panduan yang dapat diakses dan pengenalan lembut tentang topik ilmu data. Berikut adalah beberapa favorit saya bagi Anda untuk memulai, tetapi jangan ragu untuk pindah ke Google dan menemukan topik Anda sendiri:

  • Nilai SHAP menjelaskan dengan tepat bagaimana seseorang ingin dijelaskan kepada Anda oleh Samuel Mazzanti. Jika Anda tertarik dengan AI yang dapat dijelaskan, Anda dapat menggunakan nilai SHapley Additive exPlanation atau SHAP  Anda perlu tahu tentang nilai-nilainya. Panduan ini mencakup dasar-dasar pendekatan model-independen ini untuk kepentingan fitur, serta dasar-dasar teori permainan.  Untuk informasi lebih lanjut, baca panduan Mazzanti sebelum menyelami perpustakaan SHAP Python dan dokumentasinya.
  • Memahami matematika di balik penurunan gradien

Parul Pandei. Keturunan gradien adalah salah satu teknik pengoptimalan terpenting dalam pembelajaran mesin. Ini berada di bawah tenda begitu banyak algoritma dan teknik penting sehingga ada baiknya meluangkan waktu sore untuk mencari tahu cara kerjanya.

  • Gibbs dijelaskan oleh penulis sampel. Saya bangga dengan tutorial langsung ini. Dengan menggunakan contoh normal bivariat dan serangkaian visualisasi, kami membahas  pengambilan sampel dan pengambilan sampel Gibbs dari distribusi target yang kompleks. Jika Anda tertarik dengan algoritma Markov Chain Monte Carlo (MCMC) dan statistik Bayesian, tutorial ini adalah tempat yang baik untuk membangun intuisi pada statistik di balik tirai.

 

4. Baca makalah penelitian mutakhir

Sekarang, dengarkan suaraku. Saya tahu bahwa ilmu data dan makalah penelitian pembelajaran mesin sering kali penuh sesak dengan informasi, terlalu teoretis untuk berguna dalam industri ini, dan seringkali sangat membosankan. Tetapi ada nilai nyata untuk dapat mengungkap makalah penelitian mutakhir tentang sesuatu yang Anda sukai. Kemajuan dalam ilmu data dan penelitian pembelajaran mesin terjadi dengan kecepatan kilat, dan mengejar ketinggalan dapat menjadi pembeda nyata dalam membuat pekerjaan Anda menonjol. Membaca penelitian juga bisa menyenangkan jika dilakukan dengan benar.

Kunci untuk membuat penelitian Anda menyenangkan adalah memilih makalah yang tepat. Anda ingin menemukan penelitian yang (a) berhubungan dengan topik yang Anda minati, (b) menarik bagi Anda dan rekan-rekan Anda, dan (c) memiliki kode sumber yang relevan untuk Anda jelajahi dan pelajari. Situs favorit saya untuk menemukan permata ini adalah kertas berkode. Di situs web ini, kami menyusun penelitian pembelajaran mesin terbaru dan mengurutkannya berdasarkan topik sehingga Anda dapat menelusuri apa yang menarik minat Anda. Selain tautan ke makalah dan abstrak lengkap, setiap daftar dalam katalog berisi indikator bagaimana orang lain di komunitas berinteraksi dengan penelitian. Secara implisit, setiap makalah penelitian dilengkapi dengan repositori kode dan himpunan data.

 

5.  Ikuti inspirasi ilmu data baru

Media sosial (Twitter, Medium, LinkedIn, YouTube, dll.) Mengikuti ilmuwan data, insinyur pembelajaran mesin, dan teknolog yang tepat adalah cara yang bagus untuk mengikuti teknologi, teknologi, dan tren terbaru. Selain itu, individu yang tepat membuat konten yang memaksa mereka untuk berpikir secara mendalam tentang bagaimana ilmu data berinteraksi dengan dunia. Mengidentifikasi beberapa suara baru mungkin yang Anda butuhkan untuk membuka blokir pengembangan Anda.

Media sosial bisa menjadi tempat yang menakutkan, jadi jika Anda baru mengenal dunia media sosial ilmu data, berikut adalah beberapa tips dan sumber daya untuk Anda mulai.

  • Ikuti akun dari sumber yang melakukan pekerjaan yang Anda hormati. Chip Huyen, pakar desain sistem ML, dan blog perusahaan seperti perusahaan GovTech Civis Analytics telah ditampilkan di Itu termasuk dalam kategori ini.
  • Ikuti akun untuk mendapatkan pembaruan terbaru dan terhebat tentang bidang keahlian Anda. Akun Twitter Andrew Gell-Mann memposting tentang pekerjaan dari labnya. Twitter Mike Lopez akan membantu Anda tetap up to date dengan perkembangan baru yang menarik dalam analisis olahraga.
  • Ikuti kisah yang membuat Anda berpikir tentang asumsi yang Anda miliki atau biarkan mereka ditantang. Jelajahi Cortnie Abercrombie untuk Etika AI dan bagaimana sistem AI/ML dapat memperkuat bias sosial dan demografis yang ada. Atau ikuti Allie Miller dan nikmati semua itu sedikit.
  • Ikuti kami untuk akun yang menyenangkan dan tertawa terbahak-bahak. Lihat jaring saraf menebak meme (sama-sama).

 

 

Leave a Reply

Your email address will not be published.