Sindobatam

Dapatkan berita terbaru

Visualisasi unik jaringan saraf: dekoder mesin versus pengenalan sensorik manusia

Visualisasi unik jaringan saraf: dekoder mesin versus pengenalan sensorik manusia

ringkasan: Sebuah studi baru menyelidiki dunia misterius jaringan saraf dalam, menemukan bahwa meskipun model ini dapat mengenali objek yang mirip dengan sistem sensorik manusia, strategi pengenalannya berbeda dengan persepsi manusia. Ketika jaringan diminta untuk menghasilkan rangsangan yang mirip dengan masukan yang diberikan, jaringan tersebut sering kali menghasilkan gambar dan suara yang tidak dapat dikenali atau terdistorsi.

Hal ini menunjukkan bahwa jaringan saraf mengembangkan “konstanta” tersendiri yang sangat berbeda dari pola persepsi manusia. Penelitian ini memberikan wawasan dalam mengevaluasi model yang meniru persepsi sensorik manusia.

Fakta-fakta kunci:

  1. Jaringan saraf dalam, ketika menghasilkan rangsangan yang mirip dengan masukan yang diberikan, sering kali menghasilkan gambar atau suara yang tidak memiliki kemiripan dengan targetnya.
  2. Model tampaknya mengembangkan konstanta unik, berbeda dari sistem persepsi manusia, yang membuat mereka mempersepsikan rangsangan secara berbeda dari manusia.
  3. Penggunaan pelatihan kompetitif dapat membuat rangsangan yang dihasilkan model lebih mudah dikenali oleh manusia, meskipun rangsangan tersebut tidak identik dengan masukan aslinya.

sumber: dengan

Sistem indera manusia sangat baik dalam mengenali hal-hal yang kita lihat atau kata-kata yang kita dengar, meskipun benda tersebut terbalik atau kata tersebut diucapkan dengan suara yang belum pernah kita dengar sebelumnya.

Model komputer yang dikenal sebagai jaringan saraf dalam dapat dilatih untuk melakukan hal yang sama, dengan benar mengidentifikasi gambar seekor anjing terlepas dari warna bulunya, atau mengidentifikasi sebuah kata terlepas dari nada suara pembicara. Namun, sebuah studi baru yang dilakukan oleh ahli saraf di MIT menemukan bahwa model ini sering kali merespons gambar atau kata yang berbeda dengan target dengan cara yang sama.

Ketika jaringan saraf ini digunakan untuk menghasilkan gambar atau kata yang merespons dengan cara yang sama seperti masukan alami tertentu, seperti gambar beruang, sebagian besar jaringan tersebut menghasilkan gambar atau suara yang tidak dapat dikenali oleh pengamat manusia. Hal ini menunjukkan bahwa model-model ini membangun “invarian” mereka sendiri, yang berarti bahwa model-model tersebut merespons rangsangan dengan fitur yang sangat berbeda dengan cara yang sama.

Temuan ini menawarkan cara baru bagi para peneliti untuk mengevaluasi seberapa baik model ini meniru organisasi persepsi sensorik manusia, kata Josh McDermott, profesor ilmu otak dan kognitif di MIT dan anggota McGovern Institute for Brain Research dan MIT’s Center for Brains. . Pikiran dan mesin.

“Makalah ini menunjukkan bahwa Anda dapat menggunakan model ini untuk mengekstrak sinyal abnormal yang pada akhirnya mengarah pada diagnosis representasi dalam model,” kata McDermott, penulis utama studi tersebut. “Pengujian ini harus menjadi bagian dari rangkaian pengujian yang kami gunakan sebagai lapangan untuk mengevaluasi model.”

Jenelle Feather Ph.D. ’22, yang sekarang menjadi peneliti di Pusat Ilmu Saraf Komputasi di Institut Flatiron, adalah penulis utama makalah akses terbuka, yang terbit hari ini di Ilmu saraf normal. Guillaume Leclerc, seorang mahasiswa pascasarjana di MIT, dan Alexandre Madry, Profesor Irama Sistem Desain untuk Komputasi di MIT, juga merupakan penulis makalah ini.

Persepsi berbeda

Dalam beberapa tahun terakhir, para peneliti telah melatih jaringan saraf dalam yang dapat menganalisis jutaan masukan (suara atau gambar) dan mempelajari fitur-fitur umum yang memungkinkan mereka mengklasifikasikan kata atau objek target dengan akurasi yang sama seperti manusia. Model-model ini saat ini dianggap sebagai model utama sistem sensor biologis.

Diperkirakan bahwa ketika sistem sensorik manusia melakukan kategorisasi jenis ini, ia belajar mengabaikan fitur-fitur yang tidak terkait dengan identitas dasar suatu objek, seperti jumlah cahaya yang menyinari objek tersebut atau sudut pandangnya. Hal ini dikenal sebagai invarian, yang berarti bahwa objek dianggap sama meskipun objek tersebut menunjukkan perbedaan dalam fitur yang kurang penting.

“Secara klasik, cara kita berpikir tentang sistem sensorik adalah bahwa mereka membangun invarian untuk semua sumber variasi yang dapat dimiliki oleh contoh berbeda dari hal yang sama,” kata Feather. “Organisme harus memahami bahwa mereka adalah hal yang sama, meskipun mereka tampak sebagai sinyal sensorik yang sangat berbeda.”

Para peneliti bertanya-tanya apakah jaringan saraf dalam yang dilatih untuk melakukan tugas klasifikasi mungkin mengembangkan invarian serupa. Untuk mencoba menjawab pertanyaan ini, mereka menggunakan model ini untuk menghasilkan rangsangan yang menghasilkan jenis respons yang sama dalam model sebagai contoh stimulus yang diberikan peneliti kepada model tersebut.

Mereka menyebut rangsangan ini sebagai “ukuran khas”, yang menghidupkan kembali gagasan dari penelitian persepsi klasik di mana rangsangan yang tidak dapat dibedakan dari suatu sistem dapat digunakan untuk mendiagnosis konstanta sistem tersebut. Konsep analogi awalnya dikembangkan dalam studi persepsi manusia untuk menggambarkan warna yang tampak identik meskipun tersusun dari panjang gelombang cahaya yang berbeda.

Yang mengejutkan mereka, para peneliti menemukan bahwa sebagian besar gambar dan suara yang dihasilkan dengan cara ini tidak menyerupai contoh yang diberikan oleh model. Sebagian besar gambar merupakan kumpulan piksel yang tampak acak, dan suaranya seperti suara bising yang tidak dapat dipahami. Saat peneliti menunjukkan gambar tersebut kepada pengamat manusia, dalam banyak kasus, manusia tidak mengkategorikan gambar yang disintesis oleh model ke dalam kategori yang sama dengan contoh target aslinya.

“Mereka sebenarnya tidak dapat dikenali oleh manusia. Mereka tidak terlihat atau terdengar alami, dan mereka tidak memiliki fitur yang dapat ditafsirkan yang dapat digunakan siapa pun untuk mengklasifikasikan suatu objek atau kata,” kata Feather.

Hasilnya menunjukkan bahwa model tersebut entah bagaimana telah mengembangkan konstanta mereka sendiri yang berbeda dari yang ditemukan dalam sistem kognitif manusia. Hal ini menyebabkan model menganggap pasangan stimulus sama meskipun berbeda secara signifikan dengan manusia.

Konstanta yurisprudensi

Para peneliti menemukan efek yang sama pada banyak paradigma penglihatan dan pendengaran yang berbeda. Namun, masing-masing model ini tampaknya mengembangkan konstanta uniknya sendiri. Ketika alat ukur dari satu model dipresentasikan ke model lain, alat ukur pada model kedua tidak begitu mudah dikenali dibandingkan dengan pengamat manusia.

“Kesimpulan utama dari hal ini adalah bahwa model-model ini tampaknya memiliki apa yang kami sebut invarian karakteristik,” kata McDermott. “Mereka telah belajar untuk menjadi invarian terhadap dimensi spesifik dari bidang stimulus ini, yang spesifik untuk model tertentu, sehingga model lain tidak memiliki invarian yang sama.”

Para peneliti juga menemukan bahwa mereka dapat menstimulasi metrik model agar lebih mudah dikenali oleh manusia menggunakan pendekatan yang disebut pelatihan adversarial. Pendekatan ini awalnya dikembangkan untuk mengatasi keterbatasan lain dari model pengenalan objek, yaitu perubahan kecil yang hampir tidak terlihat pada gambar dapat menyebabkan model salah mengenalinya.

Para peneliti menemukan bahwa pelatihan kompetitif, yang melibatkan penyertaan beberapa gambar yang sedikit dimodifikasi ini ke dalam data pelatihan, menghasilkan model yang metriknya lebih dapat dikenali oleh manusia, meskipun masih belum dapat dikenali seperti rangsangan aslinya. Para peneliti mengatakan peningkatan ini tampaknya tidak bergantung pada pengaruh pelatihan terhadap kemampuan model untuk melawan serangan musuh.

“Jenis pelatihan ini memiliki dampak yang besar, namun kami tidak mengetahui secara pasti mengapa hal tersebut bisa terjadi,” kata Feather. “Ini adalah area untuk penelitian di masa depan.”

Menganalisis metrik yang dihasilkan oleh model komputasi dapat menjadi alat yang berguna untuk membantu mengevaluasi seberapa dekat model komputasi meniru organisasi dasar sistem persepsi manusia, kata para peneliti.

“Ini adalah tes perilaku yang dapat Anda lakukan pada model tertentu untuk melihat apakah konstanta tersebut dimiliki bersama antara model dan pengamat manusia,” kata Feather. “Ini juga dapat digunakan untuk mengevaluasi seberapa spesifik konstanta dalam model tertentu, yang dapat membantu mengungkap potensi cara untuk meningkatkan model kami di masa depan.”

Pembiayaan: National Science Foundation, National Institutes of Health, Department of Energy Graduate Fellowship in Computational Science, dan Friends of the McGovern Institute Fellowship mendanai penelitian ini.

Tentang Berita Penelitian Kecerdasan Buatan dan Kognisi

pengarang: Sarah McDonnell
sumber: dengan
komunikasi: Sarah McDonnell – Institut Teknologi Massachusetts
gambar: Gambar dikreditkan ke Berita Neuroscience

Pencarian asli: Akses terbuka.
Alat pengukuran umum mengungkapkan berbagai invarian antara jaringan saraf biologis dan buatan“Oleh Josh McDermott dkk. Ilmu saraf normal


ringkasan

Alat pengukuran umum mengungkapkan berbagai invarian antara jaringan saraf biologis dan buatan

Model jaringan saraf dalam dari sistem sensorik sering diusulkan untuk mempelajari transformasi representasional dengan invarian seperti yang ada di otak. Untuk mengungkap invarian ini, kami menciptakan “stimulus model”, yaitu rangsangan yang aktivasinya dalam fase model cocok dengan aktivasi dalam stimulus alami.

Instrumen untuk model penglihatan dan pendengaran jaringan saraf modern yang diawasi dan tidak diawasi sering kali sama sekali tidak dapat dikenali oleh manusia ketika dihasilkan dari tahap model akhir, sehingga menunjukkan perbedaan antara model dan invarian manusia. Perubahan model yang ditargetkan meningkatkan pengenalan manusia terhadap alat pengukuran model tetapi tidak menghilangkan perbedaan model manusia secara keseluruhan.

Metrik model yang dapat dikenali oleh manusia diprediksi dengan baik oleh model lain yang dapat dikenali, sehingga menunjukkan bahwa model berisi invarian berbeda selain invarian yang diperlukan oleh tugas.

Kemampuan mengenali metamer dipisahkan dari kriteria tradisional berbasis otak dan kriteria permusuhan lemah, mengungkapkan mode kegagalan yang berbeda dari model sensorik yang ada dan memberikan kriteria pelengkap untuk evaluasi model.