SAN FRANCISCO – Lanskap kecerdasan buatan (Artificial Intelligence – AI) yang semakin kompetitif kini diwarnai konflik terbuka antara dua raksasa teknologi. Amazon, e-commerce dan cloud provider terbesar di dunia, dilaporkan telah mengirimkan ancaman hukum kepada startup AI yang sedang naik daun, Perplexity. Ancaman ini berpusat pada dugaan praktik “agentic browsing” yang dilakukan oleh mesin pencari AI milik Perplexity. Praktik ini dituduh melanggar ketentuan yang diatur dalam protokol robots.txt milik Amazon, yang secara tegas membatasi scraping data. Situasi ini bukan sekadar perselisihan teknis, melainkan representasi dari konflik yang lebih luas tentang hak cipta data dan etika penggunaan AI dalam mengambil informasi dari web. Laporan bahwa Amazon Ancam Perplexity Hukum menegaskan betapa berharganya data sebagai bahan bakar revolusi AI.
Apa Itu Agentic Browsing dan Mengapa Amazon Khawatir?
Konflik ini berpusat pada cara kerja Perplexity. Perplexity adalah mesin pencari berbasis AI generatif yang tidak hanya mengindeks konten web, tetapi juga melakukan “agentic browsing”. Ini berarti AI tersebut bertindak sebagai agen otonom yang dapat berinteraksi dengan situs web secara dinamis, mengumpulkan, merangkum, dan menyajikan informasi langsung kepada pengguna. Berbeda dengan crawler mesin pencari tradisional, agentic browsing memiliki kemampuan yang lebih mendalam dalam mengekstrak dan memproses data kompleks.
Amazon khawatir bahwa agentic browsing Perplexity secara sengaja atau tidak sengaja mengabaikan arahan robots.txt. Protokol robots.txt adalah mekanisme standar yang digunakan pemilik situs web untuk memberi tahu web crawler dan bot bagian mana dari situs yang boleh diakses dan diindeks, serta bagian mana yang harus dihindari.
Alasan utama kekhawatiran Amazon adalah ganda:
- Pelanggaran Hak Cipta dan Ketentuan Layanan (ToS): Amazon berargumen bahwa Perplexity melanggar batas-batas yang ditetapkan Amazon untuk melindungi data dan kekayaan intelektualnya.
- Beban Infrastruktur: Scraping data dalam skala besar dapat membebani infrastruktur server Amazon. Perplexity mungkin mendapatkan keuntungan dari informasi Amazon tanpa harus menanggung biaya infrastruktur terkait.
- Deep Linking yang Melangkahi Iklan: Terdapat kekhawatiran bahwa hasil rangkuman dari Perplexity memungkinkan pengguna mendapatkan jawaban tanpa perlu mengunjungi situs sumber secara langsung. Hal ini merusak model bisnis Amazon, di mana traffic dan iklan adalah sumber pendapatan utama.
Perplexity Membela Diri dan Tantangan Robots.txt
Menanggapi ancaman hukum tersebut, Perplexity, melalui CEO Aravind Srinivas, memberikan pembelaan yang kuat. Srinivas berargumen bahwa Perplexity mematuhi robots.txt sesuai dengan interpretasi standar industri. Mereka mengklaim bahwa praktik mereka, meskipun canggih, berada dalam batas-batas etika dan hukum yang ada.
Namun, sengketa ini menyoroti kelemahan mendasar dari protokol robots.txt di era AI:
- Ambigu di Era LLM: Robots.txt diciptakan jauh sebelum munculnya LLM yang mampu melakukan agentic browsing. Protokol ini tidak sepenuhnya siap menghadapi bot AI yang tidak hanya mengindeks, tetapi juga “memahami” dan “meringkas” konten.
- Perdebatan Etika: Inti dari perdebatan ini adalah etika penggunaan data publik. Perplexity berpendapat bahwa mereka memanfaatkan data yang sudah tersedia untuk umum, sama seperti mesin pencari lainnya. Namun, para penerbit, termasuk Amazon, berpendapat bahwa AI menggunakan data tersebut untuk menghasilkan produk baru yang pada dasarnya bersaing langsung dengan sumber aslinya.
Kasus Amazon Ancam Perplexity Hukum ini menjadi preseden penting yang akan mendefinisikan batas-batas apa yang boleh dan tidak boleh dilakukan oleh startup AI dalam mengumpulkan data.
Perang AI dan Nilai Data
Ancaman hukum dari Amazon terhadap Perplexity bukan kasus terisolasi; ini adalah bagian dari “perang data” yang lebih besar di antara raksasa teknologi dan startup AI. Data, terutama data web yang kaya dan berkualitas tinggi, telah menjadi komoditas paling berharga dalam perlombaan pengembangan model bahasa.
Beberapa kasus lain yang serupa meliputi:
- OpenAI vs. New York Times: Kasus gugatan copyright terbesar, di mana NYT menuduh OpenAI menggunakan jutaan artikel mereka tanpa izin untuk melatih model AI.
- Gugatan Terhadap Google Gemini: Kasus serupa tentang penggunaan data berhak cipta untuk melatih model AI generatif.
Bagi Amazon, melindungi data e-commerce dan marketplace mereka adalah hal yang krusial. Data tersebut mencakup harga, inventaris, ulasan pelanggan, dan tren pembelian—informasi yang sangat berharga yang dapat digunakan oleh pesaing untuk mendapatkan keuntungan. Jika Perplexity dapat menyajikan rangkuman akurat tentang produk dan harga Amazon tanpa mengarahkan traffic kembali ke Amazon, hal ini dapat mengancam model bisnis inti mereka.
Masa Depan Web Scraping dan Regulasi AI
Keputusan akhir dalam konflik antara Amazon dan Perplexity, baik melalui penyelesaian di luar pengadilan atau putusan pengadilan, akan sangat memengaruhi masa depan web scraping dan pengembangan AI generatif. Industri membutuhkan kejelasan hukum yang lebih baik tentang bagaimana LLM diperbolehkan berinteraksi dengan konten berhak cipta dan protokol robots.txt.
Jika pengadilan mendukung Amazon, ini dapat membatasi kemampuan agentic browsing secara drastis, memaksa Perplexity dan startup AI lainnya untuk bernegosiasi dan membayar untuk akses ke data premium. Sebaliknya, jika pengadilan memenangkan Perplexity, hal itu akan memberikan kebebasan yang lebih besar bagi AI untuk mengakses dan merangkum konten publik, meskipun berpotensi merugikan penerbit dan pemilik data. Kasus Amazon Ancam Perplexity Hukum adalah pertarungan hukum yang menguji batas-batas teknologi lama (robots.txt) dan teknologi baru (AI agentic browsing), yang hasilnya akan membentuk ekosistem digital di masa depan.
Baca juga:
- Google Tarik Gemma Defamasi: Skandal AI dan Tuduhan Pencemaran Nama Baik
- Perplexity Lisensi Gambar Getty Images: Babak Baru Etika Konten dalam AI
- Apa Itu ChatGPT? Panduan Lengkap Chatbot AI Revolusioner
Informasi ini dipersembahkan oleh paus empire

