Gawat, Microsoft Copilot Dapat Mengakses Repository Privat GitHub!

Advertisements

Kabar mengejutkan datang pada bulan Agustus 2024, ketika sebuah postingan LinkedIn menuduh ChatGPT bersama Microsoft Copilot mampu mengakses data repository privat GitHub.

Terang saja, jika tuduhan serius ini benar, dampaknya akan sangat besar terhadap keamanan dan privasi data.

Menyikapi hal tersebut, sekelompok peneliti Lasso Security melakukan investigasi untuk membuktikan kebenarannya. Tim dari Lasso meneliti ChatGPT dan Microsoft Copilot. Hasil investigasinya ternyata cukup mengkhawatirkan.

Advertisements

Investigasi Awal

artificial intelligence

Keamanan data menjadi fokus di tengah gempuran teknologi AI

Investigasi ini dimulai dengan penyelidikan awal. Dari penyelidikan awal tersebut, ChatGPT hanya dapat mengindikasikan keberadaan repository melalui cache Bing. Terutama ketika sebuah repository GitHub pernah bersifat publik. Sebagai informasi, ChatGPT mengandalkan Bing untuk pengindeksan website ketika menyusun jawaban dari pertanyaan user. Karena itulah, ChatGPT tidak menyediakan data hasil repository tersebut.

Lantas, bagaimana dengan Microsoft Copilot?

Berbeda dengan ChatGPT, Microsoft Copilot mampu mengekstrak data aktual dari saat data repository tersebut bersifat publik. Copilot dapat mengakses snapshot cache dari isi repository.

Hal ini menurut Lasso, memunculkan apa yang disebut dengan Data Zombie. Data Zombie adalah informasi yang keberadaannya sudah dibuat dalam mode privat atau sudah dihapus, namun tetap dapat diakses jika disimpan dalam cache.

Penyelidikan Lebih Lanjut

Dengan menggunakan dataset aktivitas GitHub dari Google BigQuery, Lasso menyusun daftar semua repository yang pernah bersifat publik pada tahun 2024, namun kini telah disetel menjadi privat.

Alur kerja tim riset Lasso adalah sebagai berikut:

  1. Mengidentifikasi aktivitas publik: Lasso mengisolasi repository yang pernah bersifat publik namun tak lagi dapat diakses. Baik karena dihapus maupun disetel privat.
  2. Menelusuri cache Bing: Untuk setiap repository yang ditandai sebagai “hilang”, Lasso melakukan pencarian menggunakan Bing untuk menemukan catatan cache terkait.
  3. Memindai data yang terekspos: Data cache yang diekstrak dianalisis untuk mencari informasi sensitif.

Advertisements

Temuan Peneliti Lasso

  • Lebih dari 20.530 repository GitHub diidentifikasi dapat diakses melalui cache Bing meskipun sudah dijadikan privat atau dihapus.
  • 16.290 organisasi terpengaruh, termasuk para raksasa teknologi seperti Microsoft, Google, Intel, Huawei, Paypal, IBM, dan Tencent.
  • Lebih dari 100 paket rentan dan lebih dari 300 kredensial privat atau rahasia (untuk platform seperti GitHub, OpenAI, dan Google Cloud) terekspos, menggambarkan besarnya permasalahan.

Tanggapan Microsoft

Setelah mendapati temuan tersebut, tim Lasso menghubungi Microsoft untuk memberi tahu tentang temuan ini. Walaupun mengakui masalah tersebut, Microsoft mengkategorikannya sebagai risiko skala rendah karena dampaknya yang terbatas. Meski demikian, Microsoft segera bertindak untuk mengatasi masalah tersebut.

Dalam waktu dua minggu, fitur tautan cache Bing dihapus dan domain cc.bing.com, yang menyimpan halaman-halaman cache, dinonaktifkan.

Namun ternyata perbaikan tersebut hanya di permukaan. Hasil cache terus muncul dalam pencarian Bing dan yang paling mengkhawatirkan, Microsoft Copilot masih memiliki akses ke data sensitif yang tersembunyi.

Pada Januari 2025, Lasso sekali lagi menguji situasi tersebut setelah mengetahui tentang laporan repository GitHub yang terkait dengan laporan TechCrunch.

Dari pengujian tersebut terungkap bahwa meskipun repository tersebut dihapus Microsoft karena alasan hukum, Copilot masih berhasil mengambil isinya.

Advertisements

Tantangan Risiko Keamanan Masa Depan

cyber security

Privasi adalah sesuatu yang harus dilindungi

Meledaknya penggunaan LLM (Large Language Model) telah memunculkan ancaman baru terhadap keamanan data organisasi. Tidak seperti risiko keamanan biasa yang diakibatkan kebocoran data atau peretasan, kemampuan Copilot untuk menampilkan data zombie dari cache telah mengekspos kerentanan yang jarang disadari.

Temuan Lasso, bersama dengan respon “nanggung” Microsoft, menyoroti tantangan kedepan yang ditimbulkan oleh data zombie dan pengaruh yang besar dari tools AI generatif.

Di era ketika data adalah raja dan LLM adalah konsumen yang kelaparan, organisasi harus mengelola setiap byte data yang keluar. Karena begitu sebuah data keluar ke publik, data tersebut tidak pernah benar-benar bisa ditarik kembali.

Ikuti berita terbaru tentang artificial intelligence hanya di Tonjoo Studio!

 

Last Updated on Maret 26, 2025 by taufiq.prasetya

Bagikan ke:
taufiq.prasetya
Ditulis oleh

taufiq.prasetya

Penggemar teknologi informasi dan sepak bola. Suka ngobrolin IT sembari minum kopi. Fans Manchester United garis tabah.

Advertisements

Leave a Reply

Alamat email Anda tidak akan dipublikasikan.

Situs ini menggunakan Akismet untuk mengurangi spam. Pelajari bagaimana data komentar Anda diproses.