Prompt Injection Ungkap Celah Keamanan di Apple Intelligence

https://www.facebook.com/pibitek

August 18, 2024 Govan

image owner: gizchina

TL;DR

Apple Intelligence rentan terhadap serangan prompt injection, sehingga menimbulkan kekhawatiran tentang keamanan AI.
Serangan prompt injection memungkinkan penyerang memanipulasi AI dengan memasukkan perintah yang mengarahkan sistem untuk "mengabaikan instruksi sebelumnya".
Evan Zhou menemukan kerentanan pada Apple Intelligence, yang menunjukkan risiko keamanan yang lebih luas terkait dengan teknologi AI.

pibitek.biz -Apple Intelligence, fitur AI terbaru Apple, akan menjadi komponen utama dalam iOS 18.1 yang akan dirilis pada Oktober 2024. Fitur ini diharapkan dapat membawa fungsi yang lebih baik pada perangkat Apple dan mengubah cara pengguna berinteraksi dengan teknologi. Namun, ketika tanggal peluncuran semakin dekat, sebuah celah keamanan yang signifikan telah ditemukan oleh seorang ahli, Evan Zhou. Celah ini ditemukan pada versi beta Apple Intelligence yang berjalan pada macOS 15.1 dan membuat AI rentan terhadap serangan prompt injection.

Serangan prompt injection adalah jenis eksploitasi yang menargetkan sistem AI yang ber basis pada LLM. Ini memungkinkan penyerang untuk memanipulasi AI agar melakukan tindakan yang tidak diinginkan. Zhou berhasil memanipulasi Apple Intelligence dengan beberapa baris kode, sehingga menimbulkan kekhawatiran tentang kesiapan sistem ini untuk dirilis secara luas dan menyoroti risiko keamanan yang lebih luas terkait dengan teknologi AI. Penyebab akar dari kerentanan ini terletak pada desain LLM, yang berbeda dari sistem software tradisional.

Pada software tradisional, instruksi program telah ditetapkan dan tidak berubah, dengan input pengguna diproses secara independen dari kode dasar. Namun, pada LLM, batas antara kode dan input menjadi kabur.AI sering menggunakan input yang diterima untuk menghasilkan respons, yang memperkenalkan fleksibilitas tetapi juga meningkatkan risiko eksploitasi.

Penemuan celah keamanan pada Apple Intelligence oleh Evan Zhou telah menarik perhatian pada risiko serius yang ditimbulkan oleh serangan prompt injection. Eksperimen Zhou dengan AI menunjukkan bahwa memungkinkan untuk memanipulasi AI agar mengabaikan instruksi awalnya, hanya dengan memasukkan perintah yang mengarahkan sistem untuk "mengabaikan instruksi sebelumnya". Ini memungkinkan Zhou untuk melewati batasan yang dimaksudkan pada AI, menyebabkan AI merespons dengan cara yang tidak diantisipasi oleh pengembangnya. Keberhasilan upaya Zhou sebagian besar karena informasi dari pengguna Reddit, yang memiliki informasi tentang template prompt Apple Intelligence.

Dengan memahami token khusus yang digunakan untuk memisahkan peran sistem dari peran pengguna dalam AI, Zhou dapat membuat prompt yang secara efektif menimpa instruksi awal sistem. Temuan Zhou, yang kemudian ia bagikan di GitHub, menunjukkan kemudahan dengan mana prompt injection dapat menembus bahkan sistem AI yang canggih seperti Apple Intelligence. Impikasi nyata dari serangan prompt injection melampaui kekhawatiran keamanan segera.

Untuk perusahaan dan individu yang mengandalkan sistem AI untuk menangani informasi sensitif, potensi pelanggaran data adalah ancaman yang signifikan. Penyerang dapat menggunakan prompt injection untuk mengekstrak detail rahasia dari AI, termasuk data pribadi, operasi internal perusahaan, atau bahkan protokol keamanan yang tertanam dalam data pelatihan model. Selain kekhawatiran privasi, serangan prompt injection dapat menyebabkan pembuatan konten berbahaya atau penyebaran informasi palsu.

Misalnya, pada kasus bot Remoteli.io, prompt injection digunakan untuk memanipulasi AI agar memposting pernyataan yang merugikan dan berita palsu, yang dapat memiliki konsekuensi yang luas jika tidak segera ditangani. Kemampuan penyerang untuk mengeksploitasi kerentanan ini menyoroti kebutuhan akan langkah-langkah keamanan yang lebih kuat dalam pengembangan AI.

Untuk melawan risiko prompt injection, perusahaan harus mengambil langkah-langkah yang lebih luas. Beberapa perusahaan telah mulai menerapkan langkah-langkah untuk mengurangi kerentanan ini, seperti membuat aturan untuk mendeteksi input pengguna yang berbahaya. Misalnya, OpenAI menerapkan daftar prioritas pada April 2024, yang memberikan prioritas lebih tinggi pada tugas dari pembuat, pengguna, dan alat pihak ketiga.

Rencana ini bertujuan untuk memastikan bahwa tugas prioritas tetap berjalan, bahkan ketika ada beberapa prompt. Namun, keamanan penuh masih sulit dicapai. Model teks besar, seperti yang digunakan pada ChatGPT atau Apple AI, masih menunjukkan kerentanan terhadap serangan prompt injection dalam beberapa kasus. Tugasnya terletak pada integrasi yang sulit dari tools ini dan pekerjaan yang sulit untuk melihat semua cara yang mungkin digunakan oleh penyerang untuk mengeksploitasi kerentanan ini.

Seiring dengan perkembangan AI, cara-cara yang digunakan oleh penyerang untuk mengeksploitasi kerentanan ini juga akan berkembang, sehingga memerlukan pengawasan yang terus-menerus dan ide-ide baru dalam langkah-langkah keamanan. Selain prompt injection, LLM juga menghadapi risiko baru: SQL injection. Seperti prompt injection, SQL injection terjadi ketika token yang tidak biasa dalam input string menyebabkan model berperilaku tidak diinginkan.

Dalam laporan yang menunjukkan kerentanan ini oleh Andrej Karpathy, ketika parser token LLM melihat beberapa kode, dapat menyebabkan hasil yang tidak diinginkan. Risiko-risiko ini sulit ditemukan dan tidak banyak diketahui, sehingga menjadi risiko yang tersembunyi tetapi signifikan dalam pekerjaan AI. Saran Karpathy untuk mengurangi kerentanan ini termasuk menggunakan flag untuk menangani token yang tidak biasa dengan lebih baik dan memastikan bahwa panggilan encode/decode tidak memparse string untuk token yang tidak biasa.

Dengan menggunakan rencana-rencana ini, pembuat dapat mengurangi risiko perilaku yang tidak diinginkan pada alat AI mereka, meskipun pekerjaan yang sulit dari model-model ini berarti bahwa beberapa risiko akan tetap ada. Dengan perubahan dalam ancaman AI, pengembang harus mengambil langkah-langkah yang cerdas untuk melindungi alat mereka. Salah satu tips utama adalah memisahkan input perintah dari input pengguna, yang dapat membantu mencegah penyerang menambahkan prompt yang berbahaya.

Ini sesuai dengan konsep "memisahkan jalur data dan kontrol", yang telah dipromosikan oleh para profesional selama beberapa waktu. Selain itu, pengembang harus memeriksa token mereka dan menguji kode mereka dengan baik untuk menemukan kerentanan. Pembaruan dan pemeriksaan rutin langkah-langkah keamanan sangat penting, karena alat AI terus berkembang dan ancaman baru muncul. Dengan tetap di depan ancaman-ancaman ini, pembuat dapat melindungi alat AI mereka dari kerusakan.

Penemuan kerentanan pada Apple AI menunjukkan pekerjaan yang sulit yang dihadapi oleh pembuat AI. Seiring dengan perkembangan teknologi AI, cara-cara yang digunakan oleh penyerang untuk mengeksploitasi kerentanan ini juga akan berkembang. Meskipun upaya untuk memperbaiki risiko-risiko ini sedang dilakukan, perubahan yang cepat dalam AI berarti bahwa keamanan akan tetap menjadi kekhawatiran besar untuk saat ini.

Membangun langkah-langkah keamanan yang lebih cerdas akan menjadi kunci dalam melindungi AI dari serangan prompt injection dan serangan lainnya. Lebih banyak pekerjaan, ide-ide baru, dan kerja sama dalam komunitas AI akan membantu menangani tantangan-tantangan yang sulit ini dan memastikan penggunaan AI yang aman. Peluncuran yang akan datang dari Apple Intelligence menyoroti baik potensi maupun risiko yang terkait dengan sistem AI yang canggih.

Robot Bawah Laut Canggih Guncang Industri Energi Laut • RilisRobot Bawah Laut Canggih Guncang Industri Energi Laut • Rilis

Beam, perusahaan teknologi canggih, baru aja ngeluarin robot bawah laut yang keren banget. Robot ini bisa jalan sendiri dan dikendalikan pakai AI alias AI. Kerennya lagi, robot ini bisa ngecek kondisi pembangkit listrik angin di laut. Robot ini udah diuji coba di Seagreen, pembangkit listrik angin terbesar di Skotlandia. Seagreen

Apple Galau: iPhone 16 dan Misteri Fitur Apple Intelligence - credit to: pcmag - pibitek.biz - iPad

Apple Galau: iPhone 16 dan Misteri Fitur Apple IntelligenceApple Galau: iPhone 16 dan Misteri Fitur Apple Intelligence

Apple Intelligence adalah sistem AI canggih yang digabungin jadi satu paket. Fitur Apple Intelligence masih belum jelas dan masih dalam pengembangan. iPhone... [23/23|Mar]

Alien Hominid Akhirnya Hadir di PlayStation - picture owner: gamerant - pibitek.biz - Rilis

Alien Hominid Akhirnya Hadir di PlayStation!Alien Hominid Akhirnya Hadir di PlayStation!

RPG • Gim indie klasik Alien Hominid akhirnya datang ke konsol generasi saat ini! Developer The Behemoth telah mengumumkan rencana untuk merilis port HD dari gim tersebut untuk PS4 dan PS5. Meskipun belum ada tanggal rilis yang pasti, studio tersebut telah mengkonfirmasi bahwa kedua gim Alien Hominid akan hadir, sehingga penggemar dan

Instacart Caper Cart: Ubah Belanja Jadi Petualangan - picture source: techradar - pibitek.biz - Pintar

Instacart Caper Cart: Ubah Belanja Jadi PetualanganInstacart Caper Cart: Ubah Belanja Jadi Petualangan

Caper Cart, troli belanja pintar Instacart, menggabungkan teknologi mutakhir dan fitur interaktif untuk mengubah pengalaman belanja menjadi lebih menyenangkan dan efisien. Troli ini dilengkapi dengan fitur navigasi, rekomendasi yang dipersonalisasi, dan... (Data,Gra,pibitek.biz)

Quad Tetap Solid, Sebuah Jaminan di Tengah Kekacauan Global - credit to: straitstimes - pibitek.biz - China

Quad Tetap Solid, Sebuah Jaminan di Tengah Kekacauan GlobalQuad Tetap Solid, Sebuah Jaminan di Tengah Kekacauan Global

Global — Joe Biden, si bos Amerika Serikat, mengeluarkan pernyataan yang menggembirakan tentang Quad. Dengan nada penuh keyakinan, Biden menegaskan bahwa kelompok ini akan terus solid dan bertahan, bahkan di tengah gejolak global dan ancaman perubahan kepemimpinan di Amerika Serikat. Biden, yang tengah menjadi tuan rumah pertemuan puncak Quad di kota kelahirannya,

Buktikan Kehebatan DQI: Algoritma Kuantum Patahkan Mitos - image from: scottaaronson - pibitek.biz - Industri

Buktikan Kehebatan DQI: Algoritma Kuantum Patahkan Mitos!Buktikan Kehebatan DQI: Algoritma Kuantum Patahkan Mitos!

Sebuah diskusi hangat tengah berlangsung di dunia komputasi kuantum mengenai kemampuan algoritma kuantum untuk memecahkan masalah optimasi NP-hard. Algoritma Quantum Approximate Optimization Algorithm (QAOA), yang menjadi pusat perhatian, diklaim memiliki potensi besar untuk merevolusi berbagai industri dengan kemampuannya menemukan solusi yang lebih baik untuk masalah-masalah tersebut. Namun, klaim ini seringkali {Manusia|pibitek.biz}

AI Summarizer: Penyelamat Waktu Nonton Video - picture source: techbullion - pibitek.biz - Akurasi

AI Summarizer: Penyelamat Waktu Nonton VideoAI Summarizer: Penyelamat Waktu Nonton Video

Review – AI summarizer membantu meringkas video panjang menjadi informasi singkat. Tiga AI summarizer populer adalah Eightify, TubeOnAI, dan Wordtune. Penggunaan AI summarizer...

California Bersiap Atur AI: Inovasi VS Keamanan - picture origin: techrepublic - pibitek.biz - Tenaga Kerja

California Bersiap Atur AI: Inovasi VS Keamanan • RegulasiCalifornia Bersiap Atur AI: Inovasi VS Keamanan • Regulasi

California sedang mencoba mengatur teknologi AI dengan aturan baru. Aturan ini bertujuan untuk menjaga keamanan, tapi beberapa perusahaan khawatir aturan ini akan menghambat inovasi. Senator Scott Wiener ingin menyeimbangkan regulasi dan inovasi di...

Useful Lists

by Dates :	4 Aug 20244 Aug 2024 22 Sep 202422 Sep 2024 5 Oct 20245 Oct 2024 12 Oct 202412 Oct 2024 17 Oct 202417 Oct 2024
by Authors :	Diki SetyawantaDiki Setyawanta Bob Firas SidhartaBob Firas Sidharta Govan SeptiantaGovan Septianta Ratih Aini KusumawardhaniRatih Aini Kusumawardhani
by Tags :	#inovasi#inovasi #konten#konten #platform#platform #regulasi#regulasi #user#user

Prompt Injection Ungkap Celah Keamanan di Apple Intelligence

Related Post

Useful Lists