Salah satu mekanisme pencarian data yang paling sering digunakan adalah dengan memanfaatkan Search Engine, di antaranya adalah:
- Web Crawl
- Alta Vista
- Yahoo
- MetaCrawler
- Google
Search engine terbesar saat ini, Google, merupakan favorit kebanyakan orang, hal ini disebabkan karena beberapa alasan:
1. Google memiliki database paling lengkap
2. Pencariannya cepat (pada setting default, tidak menggunakan iklan bergambar
3. Bisa menampilkan “cache”/simpanan situs yang pernah terdaftar
(meskipun situs itu sedang/sudah drop),
4. Dukungan interface sangat simple (tampilan sederhana)
5. Bisa dicustomize sesuai keinginan, bahkan form search bisa dimasukkan dalam kode desain yang kita buat
6. Google bisa mencari berdasarkan logika boolean, sehingga dia bisa menjadi mesin pencari yang bisa menyajikan data sensitif (termasuk password admin, informasi credit card, dll.).
Dalam perkembangannya, bahkan kata google menjadi sebuah "kata kerja" (verb) sehingga banyak orang menyebutkan istilah googling untuk kegiatan mencari informasi melalui search engine (google).
Sintaks yang diuraikan di berikut ini menggunakan situs-situs contoh sehingga masukannya bisa terus dikembangkan dengan praktek terus-menerus agar temuan yang didapat semakin lengkap. Google adalah tipe mesin pencari yang tidak sekadar memberikan data, melainkan memberikan pengalaman dan kejutan dalam menemukan “sesuatu” di internet.
Contoh pencarian Google yang sering salah:
Yang diketikkan : makalah pendidikan
Hasilnya : bukan halaman yang berisi "makalah pendidikan" melainkan semua halaman yang mengandung kata "makalah" saja, "pendidikan" saja. Pencarian ini kurang spesifik
Berikut ini adalah cara yang bisa Anda kembangkan sendiri:
Ketikkan: foucault “disiplin tubuh”
Artinya: Mencari halaman berisi “foucault” dan frase “disiplin tubuh”.
Kalau menemukan halaman berisi kata "foucault" saja, atau "disiplin tubuh" saja, tidak akan ditampilkan.
Google hanya akan menampilkan halaman yang berisi "foucault" DAN "disiplin tubuh".
Ketikkan: foucault “disiplin tubuh” arkeologi
Kalau di belakangnya ditambah “arkeologi” berarti hasil yang tadi disaring lagi lalu dicari yang ada
kata “arkeologi”. Cara ini populer dan sangat disarankan. jadi, ini sama dengan perintah sebelumnya,
tetapi ditambahi kata "arkeologi".
cache:www.kompas.com web
Artinya: Mencari isi yang sempat disimpan (cached content) yang mengandung kata "web" di kompas.
Fungsi ini bisa diakses seperti saat kita klik link "Cached" di hasil pencarian Google.
Masukan cache: akan menampilkan versi simpanan Google dari web yang kita cari. Mengetikkan: cache:www.astalavista.com akan menampilkan simpanan Google homepage astalavista yang berisi item web biarpun situsnya sedang drop atau sudah tutup. Tidak menutup kemungkinan, situs atau file yang tadinya terdaftar di Google sudah drop/hangus, tetapi Google masih punya simpanannya. :)
link:www.trans.tv
Untuk menampilkan semua link yang dipunyai homepage trans.tv
Sebagaimana kalau kita pakai Advanced Search pada pilihan Page Specific Search > Links
related:www.trans.tv
Memerintahkan google menampilkan halaman yang "sama" dengan halaman www.trans.tv
Fungsi ini bisa diakses sebagaimana kalau kita klik link "Similiar" di hasil pencarian Google
Sama saja kalau kita pakai Advanced Search pada pilihan Page Specific Search > Similiar
Kalau ada artikel bagus yang beralamat di http://www.sebuahsitus.com/judulartikelnya.html dan Anda ingin tahu
apakah artikel itu jiplakan, ketikkan: related: www.sebuahsitus.com/judulartikelnya.html
info:www.trans.tv
Menampilkan informasi tentang homepage www.trans.tv
define:love
Akan menyediakan definisi "love" yang dikumpulkan dari semua situs yang ada di bawah database Google
stocks:intc yhoo
Menampilkan informasi tentang Intel dan Yahoo. (Catatan: yang diketikkan adalah ticker symbol, bukan nama perusahaannya.)
Perintah ini sama halnya jika Anda Search hanya pada stock symbols (misalnya [ intc yhoo ]) lalu klik "Show stock quotes"
pada halaman hasil.
wiretap site:www.phrack.com
Menemukan halaman berisi "wiretap" (penyadapan lewat telepon) hanya pada situs www.phrack.com
wiretap site:.com
Menemukan halaman berisi "wiretap" di situs yang berakhiran .com
Sama saja kalau kita pakai Advanced Search pada pilihan Advanced Web Search > Domains
allintitle:sejarah+islam
Mencari data yang judulnya memuat kata "sejarah" dan "islam".
Sama saja dengan Advanced Search > Advanced Web Search > Occurrences.
Catatan: "judul" yang dimaksudkan bukan judul tulisan/data tetapi judul halaman, yaitu judul yang tercantum pada
"jendela"/kotakan halaman yang memuat data yang kamu cari.
intitle:sejarah+islam
Mencari data yang judulnya memuat "sejarah" dan isinya memuat "islam" tidak peduli ada di judul (nama jendela) atau tidak.
Menempatkan "intitle:" di depan setiap kata dalam pencarian sama dengan menempatkan "allintitle:" di depan pencarian.
Artinya, intitle:sejarah intitle:islam sama dengan allintitle:sejarah islam
allinurl:download free
Mencari dokumen yang URLnya mengandung kata "download" "free".
Catatan: URL (urgently requested line) sama dengan Address.
Contoh URL adalah: www.trans.tv dan www.kompas.com, harus dicatat bahwa sintaksis "allinurl:" berlaku pada kata-kata,
bukan komponen/bagian URL. Secara khusus, dia mengabaikan punctuation (tanda petik). Dengan demikian, mengetikkan
"allinurl:foo/bar" akan membatasi pencarian dengan kata "foo" dan "bar" di URL, tetapi tidak peduli apakah "foo"dan "bar"
dipisahkan dengan slash (garis miring) di dalam URLnya, merupakan kelanjutannya (dalam alamat), atau urut susunannya.
Nggak ada aturan untuk itu.
Perintah ini sama saja kalau kita pakai Advanced Search > Advanced Web Search > Occurrences.
inurl:sejarah islam
Lihat keterangan di atas, bisa pakai spasi antara inurl: dan kata berikutnya.
proposal filetype:doc
Mencari file Microsoft Word (.doc) yang mengandung kata “proposal”
Tipe file yang dikenali oleh Google:
- Adobe Portable Document Format (pdf)
(ini yang paling banyak didownload sehingga Google harus menyediakan fasilitas “View as HTML” untuk file .pdf di “Search Result”,
- Adobe PostScript (.ps),
- Worksheet Lotus 123
- MacWrite (.mw),
- Microsoft Excel (.xls),
- Microsoft PowerPoint (.ppt)
- dll.
serial3k.exe download –buy
Mencari file “serial3k.exe” yang bisa di”download” dan pada halaman hasilnya nggak ada kata “buy”
Catatan:
1. Teknik mencari dengan Google harus dipahami secara matang. Ini adalah dasar dari menjelajahi internet, mesin wajib para peneliti sekaligus kitabnya para hacker untuk melakukan “Path Disclosure”, mencari exploit, dll. Contoh cara mengeksploitasi dengan Google di: http://johnny.ihackstuff.com
2. Buatlah masukan yang spesifik. Mencari tulisan seseorang lebih tepat jika diawali dengan mencari “nama pengarang”nya. Tidaklah efektif jika mencari makalah dengan mengetikkan “Judul Makalah secara Lengkap”.
3. Google hanya memiliki database sesuai yang didaftarkan orang.
Setiap halaman yang didaftar di Google, ada yang sengaja dirancang untuk merespon “keyword” yang isinya berkebalikan dengan maksud si pencari. Banyak sekali situs pornografi XXX yang sengaja memasukkan keyword "Harry Potter" agar orang yang mengetikkan "Harry Potter" di Google diarahkan ke situs XXX tadi.
4. Google tidak sama dengan internet. Kalau tidak ada di Google bukan berarti tidak ada di internet. Manfaatkan Search Engine lain yang ada.
Setiap mesin pencari dan situs-situs yang melayani, memiliki fasilitas dan perilaku yang berbeda-beda, baca manualnya.
5. Deskripsi di “Hasil Pencarian” yang terlalu singkat dan mencurigakan, mungkin alamat trojan/virus. Lewati halaman “advertorial” (biasanya ditandai dengan “Google ads” atau “Ads by Google”) kecuali senang melihat iklan.
Tidak perlu membuka “Only $ 55” dan semacam itu (yang harus bayar) kecuali memang Anda pingin beli.
6. Halaman di domain “.com” tidak semuanya berbahasa Inggris, itu hanya mengalamatkan server, bukan alamat pemakaian bahasa. Domain tidak sama dengan wilayah bahasa/geografis. Jadi pertimbangkan ketika Anda mengatur “Preferences” yang hanya mencari di halaman berbahasa tertentu. Lakukan “penyesuaian” (customization) dan “kesenangan” (preferences) jika ingin memperlakukan Google sesuai kebutuhan.
7. Google mengutamakan “pendidikan” (education) dalam pengertian harfiah.
Situs pendidikan sangat diutamakan. Gunakan fasilitas PageRank dari “Google Toolbar” untuk melihat ranking suatu halaman. Angka 10 berarti paling top.
8. Situs Anda (mungkin friendster, blog, multiply) dapat dimasukkan dalam index Google dengan memasuki: http://www.google.com/addurl.html
04 Desember 2008
Langganan:
Posting Komentar (Atom)

2 komentar:
Manstab!!!aku koq baru ngeh ya!hahah..nice posting Bos!
bagus pak postinganya, bermanfaat buat saya, hehe
Posting Komentar