Pergeseran besar dalam interaksi manusia dan komputer kembali terjadi. Setelah revolusi virtual reality (VR), para veteran di balik Oculus—perusahaan yang diakuisisi Facebook (kini Meta) senilai $2 miliar—kini mengalihkan fokus mereka ke kecerdasan buatan (AI). Startup mereka, Sesame, baru-baru ini mengumumkan putaran pendanaan Seri B sebesar $250 juta yang dipimpin oleh Sequoia Capital dan Spark Capital. Bersamaan dengan pendanaan masif ini, Sesame juga meluncurkan akses beta untuk aplikasi iOS-nya. Langkah ini menandai dimulainya persaingan hardware AI yang baru, di mana AI percakapan Sesame diposisikan sebagai jantung dari generasi berikutnya dari smart glasses yang dirancang untuk penggunaan sehari-hari.
Dipimpin oleh mantan CEO Oculus, Brendan Iribe, dan didukung oleh tim yang terdiri dari para veteran perangkat keras dan AI, Sesame tidak hanya membuat asisten suara lainnya. Perusahaan ini berambisi untuk menciptakan agen AI pribadi yang dapat berbicara dengan suara alami, berirama, dan beremosi yang menyerupai interaksi manusia. Sejak kemunculannya dari mode stealth pada Februari 2025 dengan suara demo “Maya” dan “Miles,” perusahaan ini telah menarik lebih dari satu juta pengguna yang menghasilkan lebih dari lima juta menit percakapan. Angka ini menegaskan adanya kebutuhan pasar yang besar terhadap jenis interaksi suara yang lebih manusiawi, yang menjadi fokus utama AI percakapan Sesame.
Kekuatan di Balik Suara: Menembus ‘Uncanny Valley’
Masalah terbesar dengan asisten suara digital saat ini, seperti Siri atau Alexa, adalah nuansa robotik dan sifat interaksi yang kaku (berbasis perintah). Mereka gagal menangkap dinamika percakapan manusia, seperti jeda yang tepat, penekanan emosi, atau kemampuan untuk diinterupsi secara alami. Sesame bertekad untuk menembus ‘lembah yang menyeramkan’ (uncanny valley) dalam suara AI dengan teknologi yang mereka sebut Conversational Speech Model (CSM).
CSM pada dasarnya memungkinkan agen AI untuk menghasilkan ucapan secara langsung sebagai keluaran utama, alih-alih hanya membaca teks yang dihasilkan oleh Large Language Model (LLM). Pendekatan ini memungkinkan rhythm, timing, dan expressiveness yang jauh lebih baik—fitur-fitur penting yang membuat suatu percakapan terasa hidup.
Fitur Kunci yang Membedakan AI Percakapan Sesame
- Kecerdasan Emosional: Mampu membaca dan merespons konteks emosional dalam percakapan pengguna.
- Dinamika Percakapan: Menangani interupsi dan giliran bicara (turn-taking) yang alami.
- Kesadaran Kontekstual: Memiliki memori percakapan untuk memastikan respons selalu relevan dengan konteks yang sedang berlangsung.
Kemampuan AI percakapan Sesame untuk meniru dialog manusia adalah inti dari nilai perusahaan ini. Sequoia Capital, salah satu investor utama, secara eksplisit mencatat bahwa lapisan percakapan Sesame terasa “sangat berbeda” dan “menghasilkan ucapan secara langsung, menangkap ritme, emosi, dan ekspresivitas dialog nyata.” Keunikan inilah yang menarik pendanaan besar-besaran $250 juta.
Taruhan Besar pada Smart Glasses dan Akses Beta
Jika AI percakapan adalah otaknya, maka smart glasses adalah tubuhnya. Tidak seperti Meta yang berfokus pada headset VR yang mahal dan terisolasi, atau kacamata Augmented Reality (AR) yang berat, Sesame bertaruh pada kacamata ringan, fashion-forward, yang dirancang untuk dikenakan sepanjang hari. Kacamata ini akan berfungsi sebagai antarmuka utama, memungkinkan pengguna untuk berinteraksi dengan agen AI mereka hanya melalui suara, tanpa perlu mengeluarkan ponsel atau melihat layar.
Ini adalah pertempuran untuk antarmuka komputasi berikutnya. Para pendiri Sesame percaya bahwa interaksi berbasis suara secara real-time dan hands-free melalui kacamata akan menjadi sama pentingnya dengan peran smartphone saat ini. Latar belakang mereka dalam pengembangan hardware konsumer yang sukses, dari Oculus, memberikan kepercayaan kepada investor bahwa mereka memiliki keahlian yang dibutuhkan untuk memproduksi perangkat yang tidak hanya canggih secara teknologi tetapi juga diinginkan secara estetika oleh konsumen.
Menguji Kekuatan AI Percakapan Sesame Melalui Aplikasi iOS
Luncuran beta aplikasi iOS Sesame yang bersifat invite-only adalah langkah strategis untuk mengumpulkan data penting dan menyempurnakan interaksi suara sebelum smart glasses dirilis. Pengguna beta akan dapat menguji kemampuan inti AI, termasuk fungsi search, text, dan think. Selain itu, Sesame juga memperkenalkan kemampuan untuk mengunggah foto dan membicarakannya, menunjukkan fokus pada kesadaran konteks yang lebih kaya—sebuah fitur multimodal yang meningkatkan utilitas AI percakapan Sesame dalam kehidupan nyata.
Umpan balik dari penguji beta akan menjadi krusial. Sistem AI memerlukan penggunaan di dunia nyata untuk menyempurnakan penanganan interupsi, memori percakapan, dan pengalihan konteks antar tugas. Pembelajaran ini akan membentuk model interaksi untuk perangkat keras kacamata yang akan datang.
Masa Depan Komputasi Berbasis Suara
Pendanaan $250 juta menempatkan Sesame di garis depan perang wearable AI, menantang perusahaan-perusahaan besar seperti Meta dengan Ray-Ban miliknya dan bahkan raksasa AI lainnya. Investasi ini menyoroti keyakinan kuat di kalangan pemodal ventura bahwa agen suara real-time dan perangkat wearable yang menampungnya akan segera mencapai titik balik adopsi massal.
Meskipun tanggal rilis kacamata tersebut belum diumumkan, taruhan pada AI percakapan Sesame sangat jelas: memenangkan pertempuran suara akan membuka jalan bagi dominasi di pasar wearable. Jika konsumen benar-benar mulai lebih suka berbicara dengan AI melalui kacamata daripada menggunakan smartphone mereka, ini bisa mempercepat seluruh kategori wearable dan menjadikan suara sebagai antarmuka komputasi yang dominan.
Dengan tim yang telah terbukti berhasil membuat teknologi futuristik menjadi mainstream—seperti yang mereka lakukan pada VR—Sesame kini berada dalam posisi yang tepat untuk mengubah cara kita berinteraksi dengan AI, membawanya keluar dari kotak teks dan layar, dan masuk ke dalam percakapan yang terasa nyata.
Baca juga:
- Claude Code Hadir di Web: Revolusi Coding dari Anthropic
- Penurunan Traffic Wikipedia Akibat Ringkasan AI dan Video Sosial
- Deepfake Politik Chuck Schumer dan Dilema Platform X
Informasi ini dipersembahkan oleh paman empire

