Pencarian Tradisional vs Pencarian Berbasis LLM
Table of Contents
Dimensi | Pencarian Tradisional (Berbasis Kata Kunci) | Pencarian Berbasis LLM (Generatif) |
---|---|---|
Tujuan Utama | Pengambilan Informasi: Mengembalikan daftar dokumen relevan yang sudah ada dan telah diperingkat. | Pembuatan Informasi: Membuat jawaban baru yang disintesis dan bersifat percakapan untuk sebuah kueri. |
Teknologi Inti | Crawling, Indexing, dan Algoritma Peringkat (contoh: PageRank). | Model Bahasa Prediktif dan Retrieval-Augmented Generation (RAG). |
Sumber Data | Indeks web publik yang terus diperbarui. | Kombinasi data pelatihan statis dan pengambilan data langsung dari basis pengetahuan eksternal (termasuk web). |
Input Pengguna | Terutama kata kunci dan frasa pendek. | Pertanyaan dalam bahasa alami dan perintah percakapan yang kompleks. |
Format Output | Daftar tautan biru (SERP) dengan cuplikan (snippets). | Jawaban langsung dalam bentuk paragraf, seringkali dengan kutipan dan anjuran tindak lanjut. |
Interaksi Pengguna | Navigasi dan Transaksional: Pengguna mengklik tautan untuk meninggalkan mesin pencari dan mengunjungi situs web. | Percakapan dan Informasi: Pengguna terlibat dalam dialog, menyempurnakan pertanyaan tanpa meninggalkan antarmuka. |
Target Optimisasi | Kata kunci, backlink, dan sinyal pada halaman untuk menentukan peringkat URL tertentu. | Entitas, topik, data terstruktur, dan sinyal E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness) untuk konten yang dikutip dalam jawaban. |
Tabel
di atas membandingkan dua jenis teknologi pencarian: pencarian tradisional
yang kita kenal melalui mesin pencari seperti Google dan Bing selama
bertahun-tahun, dan pencarian berbasis LLM (Large Language Model) yang
merupakan teknologi lebih baru yang mendukung fitur seperti jawaban generatif
di Gemini, ChatGPT, atau Copilot.
Berikut
adalah penjelasan mendalam untuk setiap dimensinya:
1. Tujuan Utama
- Pencarian
Tradisional: Tujuannya adalah menjadi "pustakawan
digital". Anda memberikan kata kunci, dan ia akan mencarikan
"buku" (halaman web) yang paling relevan dari koleksinya yang
sangat besar. Hasilnya adalah daftar tautan yang perlu Anda saring sendiri
untuk menemukan jawaban.
- Pencarian Berbasis
LLM: Tujuannya lebih seperti bertanya kepada
"asisten ahli". Alih-alih hanya memberi Anda daftar sumber, ia
mencoba memahami pertanyaan Anda, mengambil informasi dari berbagai
sumber, mensintesisnya, dan memberikan jawaban langsung dalam format yang
mudah dipahami. Tujuannya adalah menciptakan informasi baru (jawaban yang
koheren) dari informasi yang sudah ada.
2. Teknologi Inti
- Pencarian
Tradisional: Prosesnya terdiri dari tiga langkah utama:
- Crawling:
"Laba-laba" (bot) mesin pencari menjelajahi internet untuk
menemukan konten baru.
- Indexing:
Konten yang ditemukan disimpan dan diatur dalam database raksasa
(indeks).
- Ranking:
Ketika Anda mencari sesuatu, algoritma seperti PageRank Google
akan menilai dan mengurutkan miliaran halaman dalam indeks berdasarkan
relevansi dan otoritas untuk memberikan hasil terbaik.
- Pencarian Berbasis
LLM: Menggunakan teknologi yang berbeda:
- Model Bahasa
Prediktif: LLM seperti GPT-4 atau LaMDA dilatih pada
dataset teks dan kode yang sangat besar untuk memahami dan menghasilkan
bahasa manusia.
- Retrieval-Augmented
Generation (RAG): Ini adalah teknik kunci. Saat Anda
bertanya, model tidak hanya mengandalkan pengetahuannya yang sudah ada
(data pelatihan). Ia secara aktif "mengambil" (retrieve)
informasi terkini dari basis pengetahuan eksternal (seperti web) dan
kemudian "membangkitkan" (generate) jawaban berdasarkan
informasi yang baru ditemukannya. Ini membantu mengurangi halusinasi
(informasi yang salah) dan memastikan jawaban lebih relevan dan akurat.
3. Sumber Data
- Pencarian
Tradisional: Bergantung sepenuhnya pada indeks web publik
yang terus-menerus diperbarui oleh proses crawling. Jika suatu
halaman tidak ada di indeks, ia tidak akan muncul di hasil pencarian.
- Pencarian Berbasis
LLM: Menggunakan dua jenis sumber data:
- Data Pelatihan
Statis: Pengetahuan "bawaan" model dari data
yang digunakan saat pelatihannya. Pengetahuan ini bisa menjadi usang.
- Pengambilan
Langsung: Melalui RAG, model dapat mengakses informasi real-time
dari internet atau database lainnya, sehingga jawabannya bisa lebih
mutakhir daripada pengetahuan statisnya.
4. Input Pengguna
- Pencarian
Tradisional: Pengguna telah dilatih untuk menggunakan
"bahasa mesin pencari"—kata kunci pendek dan spesifik untuk
mendapatkan hasil terbaik. Contoh: "restoran italia terbaik
jakarta".
- Pencarian Berbasis
LLM: Dirancang untuk memahami bahasa manusia
sehari-hari. Anda bisa bertanya dengan kalimat lengkap dan kompleks,
seolah-olah berbicara dengan orang lain. Contoh: "Bisakah kamu
merekomendasikan restoran Italia di Jakarta yang cocok untuk makan malam
romantis dengan anggaran di bawah 500 ribu per orang?"
5. Format Output
- Pencarian
Tradisional: Hasilnya adalah SERP (Search Engine Results
Page)—halaman yang didominasi oleh daftar 10 tautan biru,
masing-masing dengan cuplikan singkat (snippet) dari konten halaman
tersebut.
- Pencarian Berbasis
LLM: Memberikan jawaban langsung dalam bentuk
paragraf atau daftar yang mudah dibaca. Seringkali, jawaban ini
menyertakan kutipan ke sumber aslinya dan saran pertanyaan
lanjutan untuk mendorong dialog yang lebih dalam.
6. Interaksi Pengguna
- Pencarian
Tradisional: Interaksinya bersifat transaksional. Anda
melihat daftar hasil, mengklik tautan, mengunjungi situs web lain, lalu
kembali ke hasil pencarian jika tidak puas. Prosesnya adalah bolak-balik
antara mesin pencari dan situs web lain.
- Pencarian Berbasis LLM: Interaksinya bersifat percakapan. Anda bisa tetap berada di antarmuka yang sama untuk bertanya, mendapatkan jawaban, dan mengajukan pertanyaan lanjutan untuk menyempurnakan atau memperdalam informasi tanpa harus membuka banyak tab.
7. Target Optimisasi
- Pencarian
Tradisional (SEO Tradisional): Untuk membuat sebuah
halaman web berperingkat tinggi, para profesional SEO (Search Engine
Optimization) fokus pada:
- Kata Kunci:
Memastikan halaman berisi kata kunci yang relevan.
- Backlink:
Mendapatkan tautan dari situs web lain yang berkualitas untuk membangun
otoritas.
- Sinyal pada
Halaman: Faktor teknis seperti kecepatan situs, struktur
judul, dll.
- Pencarian Berbasis
LLM (SEO Generatif): Aturan mainnya sedikit berubah. Yang
menjadi penting adalah:
- Entitas dan
Topik: Seberapa baik konten Anda mencakup suatu
entitas (orang, tempat, benda) atau topik secara mendalam.
- Data Terstruktur:
Menggunakan markup skema untuk membantu mesin pencari memahami konten
Anda dengan lebih baik.
- E-E-A-T
(Pengalaman, Keahlian, Otoritas, Kepercayaan):
Sinyal yang menunjukkan bahwa konten Anda dibuat oleh sumber yang
tepercaya dan ahli di bidangnya. Mesin pencari generatif cenderung
mengutip dari sumber yang paling dapat diandalkan.
.gif)