From Portfolios
Misi Meeting.ai melawan pemain mapan di pasar startup transkripsi
Teknologi konversi suara ke teks (speech-to-text) sudah ada sejak lama, tetapi terobosan-terobosan dalam AI generatif kini menjadikan persaingan untuk menyempurnakannya semakin ketat.
Seketika, banyak pihak mengklaim bahwa mereka menawarkan layanan transkripsi rapat berbasis AI.
Otter.ai, yang dikenal sebagai salah satu pemimpin dalam sektor ini dengan total pendanaan lebih dari US$63 juta (Rp987,2 miliar), meluncurkan fitur chat berbasis genAI tahun lalu. Fitur ini diklaim lebih unggul dibandingkan ChatGPT. Sementara itu, Read.ai, yang baru-baru ini mendapatkan pendanaan US$50 juta (Rp783,5 miliar), ingin mengembangkan solusi AI mereka lebih dari sekadar transkripsi.
Namun, persaingan ketat di dunia transkripsi berbasis AI tidak menyurutkan semangat Hokiman Kurniawan untuk meluncurkan Meeting.ai pada tahun 2023. Startup asal Indonesia ini belum mendapatkan pendanaan eksternal sama sekali, tetapi yakin mampu bersaing di pasar global.
Memadukan model LLM
Pada tahun 2016, saat masih menjadi mahasiswa di Universitas Indonesia, Hokiman bersama rekannya mendirikan Bahasa.ai. Startup ini berfokus pada pembuatan chatbot yang dikustomisasi untuk perusahaan-perusahaan lokal. Hokiman melihat adanya permintaan besar akan alat pemrosesan bahasa alami (NLP) untuk bahasa Indonesia, yang digunakan oleh lebih dari 270 juta orang di seluruh Tanah Air.
Bahasa.ai tersebut berhasil mengamankan beberapa putaran pendanaan dari investor seperti East Ventures dan SMDV, lengan modal ventura (VC) dari konglomerasi Sinar Mas Group. Startup itu juga berhasil menarik klien besar seperti Bank Sinarmas, MyRepublic, dan Kalbe Nutritionals.
Namun, pada tahun 2022, Hokiman merasa bahwa Bahasa.ai perlu beralih haluan. “Kami menyadari saat itu bahwa kami sudah membawa bisnis ini sejauh yang kami bisa, dan kami membutuhkan produk baru yang memiliki potensi untuk berkembang di luar Indonesia,” ujarnya dalam sebuah wawancara dengan Tech in Asia baru-baru ini.
Peluncuran ChatGPT ke publik di akhir tahun 2022 telah memicu antusiasme global terhadap alat berbasis AI. Berkat tren tersebut, pengusaha lokal seperti Hokiman tak perlu lagi menjelaskan secara panjang lebar apa itu AI kepada pelanggan mereka.
Pada Juli 2023, Hokiman memanfaatkan dana yang didapat secara berkala dari Bahasa.ai — yang menurutnya berada di kisaran “jutaan dolar” — untuk meluncurkan Meeting.ai. Sementara itu, Bahasa.ai tetap beroperasi dan melayani klien yang sudah ada.
Dengan teknologi pengenalan suara (speech recognition) seperti Whisper dari OpenAI yang tersedia secara bebas dan open-source, seorang individu yang melek teknologi bisa dengan mudah membangun sebuah alat yang dapat mentranskripsi percakapan secara otomatis.
Hokiman mencatat, ketergantungan pada satu penyedia infrastruktur seperti OpenAI bisa menjadi langkah yang berisiko. Selain itu, solusi tersebut mungkin tidak efisien dari segi biaya karena ada alternatif yang lebih murah seperti Claude dari Anthropic. Ia menambahkan bahwa dengan menggabungkan beberapa model, Meeting.ai berhasil mencapai tingkat akurasi yang serupa sambil menekan biaya. Pendekatan ini membantu startup tersebut menyeimbangkan aspek kualitas dengan keterjangkauan.
Sementara itu, menurut laporan dari Associated Press baru-baru ini, Whisper cenderung sering menghasilkan teks yang tidak ada dalam percakapan yang ditranskripsi.
Bagi Meeting.ai, mengembangkan model AI sendiri secara finansial tidak memungkinkan. Bahkan jika memungkinkan, ada risiko bahwa pesaingnya bisa mengembangkan model yang lebih baik hanya dalam selang waktu beberapa minggu.
“Bahkan OpenAI, yang memiliki sumber daya yang sangat besar, hanya mampu memimpin pasar selama sekitar satu tahun sebelum perusahaan seperti Anthropic dan Google mengejar dengan model AI yang sebanding,” ujar Hokiman.
Hokiman percaya bahwa Meeting.ai dapat memperkuat posisinya di sektor ini dengan mengkurasi model AI yang sudah ada sehingga solusinya dapat beradaptasi dengan berbagai kasus penggunaan. Sebagai contoh, setelah proses transkripsi selesai, Meeting.ai menggunakan model yang berbeda untuk memeriksa kesalahan ketik, mengidentifikasi topik, dan melakukan penyelarasan dengan transkrip saat menghasilkan ringkasan.
Namun, Hokiman menemukan bahwa model-model yang saat ini ada kurang akurat saat mentranskripsi percakapan dalam bahasa Indonesia. Oleh karena itu, perusahaan mengembangkan modelnya sendiri yang dikhususkan untuk bahasa Indonesia, menggunakan data yang telah dikumpulkannya sejak tahun 2017. Meeting.ai memanfaatkan model tersebut bersama dengan opsi lainnya saat mentranskripsi percakapan dalam bahasa Indonesia.
Meeting.ai juga melakukan fine-tuning pada beberapa model open-source dengan menyuplai data pelatihan (training data) tambahan. Misalnya, untuk lebih memahami bahasa Inggris dialek Singapura (Singlish), perusahaan menmanfaatkan data suara sebesar lebih dari dua terabyte yang diperoleh dari Perpustakaan Nasional Singapura.
Meeting.ai juga mengandalkan nama domainnya sebagai keunggulan kompetitif. Hokiman menjelaskan bahwa nama tersebut memiliki potensi besar untuk optimisasi mesin pencari (SEO), memungkinkan banyak pengguna menemukan startup ini saat mencari istilah seperti “meeting AI” atau “minutes AI” di mesin pencari.
Pihak perusahaan mengatakan telah mengamankan hak merek dagang di Britania Raya, sementara pendaftaran hak merek dagang di AS saat ini masih menunggu persetujuan.
Pertarungan antar-aplikasi transkripsi AI
Seberapa baik sebenarnya Meeting.ai dalam mentranskripsi percakapan? Dan yang lebih penting, bagaimana performa Meeting.ai jika dibandingkan dengan aplikasi lainnya yang lebih mapan?
Percobaan yang Tech in Asia lakukan secara internal menunjukkan, dalam mentranskripsi percakapan dalam bahasa Inggris antara penutur non-native, akurasi Meeting.ai sebanding dengan Otter.ai dan TurboScribe.
Dalam mentranskripsi percakapan antara penutur bahasa Indonesia, Meeting.ai mampu mengenali beberapa kata slang umum seperti “gue“, “lu“, “kayak“, “pede“, dan “gede“, yang masing-masing berarti “saya”, “kamu”, “seperti”, “percaya diri”, dan “besar”. Ini menjadikan performanya setara dengan solusi dari Prosa.ai, startup lain yang berfokus pada NLP untuk bahasa Indonesia.
Menurut pihak perusahaan, Meeting.ai juga mendukung kata-kata slang berbahasa Inggris dari berbagai negara, seperti Australia, Singapura, Britania Raya, dan Amerika Serikat.
Untuk lebih menyempurnakan alat ini agar mampu mengenali slang dalam bahasa lainnya, Meeting.ai memerlukan dukungan dari mitra lokal — tetapi dukungan tersebut belum dimilikinya saat ini.
Alat ini juga dapat mendeteksi penggunaan beberapa bahasa dalam satu rapat – misalnya bahasa Inggris dan Indonesia – sebuah fitur yang saat ini tidak dimiliki oleh Otter.ai maupun Fireflies.ai.
Namun, versi web Meeting.ai saat ini belum memiliki fitur transkripsi real-time, menyulitkan pengguna yang membutuhkan umpan balik instan selama rapat. Selain itu, fitur rekaman tidak mendukung upload parsial, sehingga pengguna harus menunggu seluruh proses upload selesai setelah setiap percakapan.
“Dengan laju secepat ini, sulit bagi solusi berbasis AI bertahan sebagai satu-satunya [penguasa pasar] selama lebih dari tiga bulan.”
Selain melakukan peningkatan di area tersebut, Meeting.ai sedang menjajaki integrasi fitur yang memungkinkan pengguna menyelesaikan tugas berdasarkan percakapan mereka — seperti menyusun term sheet atau proposal — secara langsung dalam satu aplikasi.
Hokiman berharap, penambahan fitur tersebut dapat membantu startup-nya tetap kompetitif. Namun, ia sepenuhnya sadar bahwa keunggulan seperti ini hanya bersifat sementara. “Dengan laju secepat ini, sulit bagi solusi berbasis AI bertahan sebagai satu-satunya [penguasa pasar] selama lebih dari tiga bulan. Kamu harus selalu menerima kenyataan bahwa kompetitor akan segera menyusul,” ujarnya.
Belum perlu pendanaan
Menurut Hokiman, startup miliknya saat ini tidak membutuhkan pendanaan eksternal secara mendesak. Namun, ia tidak menutup kemungkinan untuk menggalang dana sekitar US$3 juta hingga US$5 juta (Rp47 miliar–Rp78 miliar) pada awal 2025 guna meningkatkan upaya pemasaran global.
Saat ini, tim Meeting.ai terdiri dari 20 orang, mayoritas adalah engineer. Startup ini memiliki lebih dari 111.000 pengguna aktif di seluruh dunia, dengan sekitar 20.000 pengguna yang mengakses aplikasi secara rutin setiap bulan.
Meskipun sang CEO tidak mengungkapkan jumlah pendapatan yang saat ini diterima perusahaan, ia mencatat bahwa 70% dari pendapatan Meeting.ai bersumber dari Indonesia. Sisanya datang dari pasar seperti Singapura, Malaysia, Britania Raya, dan Amerika Serikat.
Selain melayani pengguna individu, Meeting.ai juga menyediakan layanan untuk perusahaan dan instansi pemerintah seperti Telkomsel, Indosat, dan Badan Riset dan Inovasi Nasional (BRIN).
Berbeda dengan banyak pesaing, Meeting.ai membebankan biaya kepada pelanggan berdasarkan lama penggunaan (dalam jam), bukan per jumlah pengguna. Pengguna individu dapat memilih paket seharga US$27 (Rp422 ribu) per bulan untuk mentranskripsi hingga 10 jam rekaman. Ada juga paket seharga US$49 (Rp768 ribu) per bulan yang menawarkan transkripsi hingga 20 jam rekaman plus serta fitur tambahan.
“Model ini menjamin unit ekonomi yang positif bagi kami, karena tidak bisa diakali melalui metode berbagi akun,” jelas Hokiman.
Ia menambahkan bahwa sejak September, Meeting.ai sudah mencapai EBITDA positif. Perusahaan menargetkan untuk mencapai laba bersih “dalam waktu dekat.”
Artikel asli telah diterbitkan di Tech in Asia, 21 November 2024.