Penjelasan Fungsi dan Cara Gunakan Robots.txt Pada Website

Penjelasan Fungsi dan Cara Gunakan Robots.txt Pada Website

Robots.txt adalah file teks sederhana yang berfungsi sebagai petunjuk bagi mesin pencari tentang halaman atau bagian situs web mana yang boleh atau tidak boleh di-crawl dan diindeks. File ini ditempatkan di direktori root situs web dan membantu dalam mengontrol akses robot pencari ke situs tersebut.

Penjelasan Fungsi dan Cara Gunakan Robots.txt Pada Website

Menggunakan robots.txt penting karena memberi kontrol kepada pemilik situs atas informasi mana yang diakses dan diindeks oleh mesin pencari. Hal ini membantu mencegah crawling konten yang tidak relevan atau sensitif, mengoptimalkan penggunaan sumber daya crawler, dan dapat membantu mencegah munculnya konten duplikat di hasil pencarian.

Manfaat utama dari robots.txt termasuk pengelolaan sumber daya server dengan lebih efektif, melindungi privasi konten tertentu, dan membantu menjaga kesehatan SEO situs web. Dengan memberi petunjuk kepada mesin pencari tentang bagian mana dari situs yang harus diindeks, pemilik situs dapat lebih efisien dalam pengelolaan konten yang muncul di hasil pencarian.

Di dalam file robots.txt, direktif seperti Allow dan Disallow digunakan untuk mengatur akses. Allow memberi izin kepada mesin pencari untuk mengakses bagian tertentu dari situs, sedangkan Disallow mencegah akses. Penting untuk mencatat bahwa standar penggunaan direktif ini bisa berbeda antar mesin pencari.

Pada WordPress, robots.txt default umumnya mengizinkan akses ke semua konten, tetapi bisa disesuaikan. Contoh default untuk situs non-WordPress mungkin melarang akses ke direktori tertentu atau jenis file tertentu untuk menjaga privasi atau keamanan situs.

Contoh Kasus Penggunaan Robots.txt

Blokir semua robot kecuali Google:

User-agent: Google
Allow: /

Blokir semua robot kecuali Google dan Bing:

User-agent: Google
Allow: /
User-agent: Bing
Allow: /

User-agent: *
Disallow: /

Blokir robot yang tidak diinginkan (bad robots):

User-agent: BadBot # nama robot yang tidak diinginkan
Disallow: /

Blokir akses ke URL tertentu:

User-agent: *
Disallow: /private/ # Blokir akses ke direktori 'private'
Disallow: /tmp-*   # Blokir akses ke URL yang dimulai dengan 'tmp-'

Dengan memahami dan menggunakan robots.txt secara efektif, pemilik situs dapat memastikan bahwa mesin pencari mengindeks situs mereka dengan cara yang paling menguntungkan.

Daftar Nama Bad Robot (BadBot) Yang Harus Anda Block

  1. MJ12Bot
  2. PetalBot
  3. AspiegelBot
  4. AhrefsBot
  5. SEMrushBot
  6. DotBot
  7. MauiBot
  8. Alexibot
  9. AppEngine
  10. B2w/0.1
  11. BackDoorBot/1.0
  12. BecomeBot
  13. BlekkoBot
  14. Blexbot
  15. BlowFish/1.0
  16. Bookmark search tool
  17. BotRightHere
  18. CherryPicker
  19. EmailCollector
  20. EmailSiphon
  21. WebBandit
  22. ExtractorPro
  23. CopyRightCheck
  24. Crescent
  25. SiteSnagger
  26. ProWebWalker

Cara Membuat Robots.txt

Membuat file robots.txt untuk situs web Anda melibatkan beberapa langkah sederhana. Berikut adalah proses langkah demi langkah:

1. Identifikasi Kebutuhan Situs Anda

Tentukan halaman atau direktori mana yang ingin Anda blokir dari mesin pencari.

Pertimbangkan apakah ada crawler khusus (seperti bot pencarian gambar) yang Anda ingin izinkan atau tolak.

2. Membuat File Robots.txt

Buka teks editor pilihan Anda, seperti Notepad atau VSCode.

Buat file baru dan simpan dengan nama robots.txt.

3. Menulis Aturan Dasar

Mulai dengan menentukan user agent menggunakan User-agent:, diikuti oleh nama bot.

Contoh: User-agent: * (aplikasi aturan untuk semua bot).

Tentukan halaman atau direktori yang diizinkan atau ditolak.

Contoh: Disallow: /private/ (blokir akses ke direktori /private).

Atau: Allow: /public/ (izinkan akses ke direktori /public).

4. Menambahkan Aturan Spesifik

Untuk bot tertentu, Anda dapat menulis aturan khusus.

Contoh:

User-agent: Googlebot (aturan hanya untuk Googlebot).

Disallow: /no-google/ (blokir Googlebot dari direktori /no-google).

5. Menggunakan Wildcards

Gunakan tanda * sebagai wildcard untuk mencakup berbagai URL.

Contoh: Disallow: /tmp-* (blokir semua URL yang dimulai dengan /tmp-).

6. Menentukan Lokasi Sitemap

Jika Anda memiliki sitemap, tambahkan URL sitemap di akhir file.

Contoh: Sitemap: http://www.contoh.com/sitemap.xml.

7. Simpan dan Upload File

Simpan file robots.txt.

Upload file ke direktori root situs web Anda menggunakan FTP atau file manager hosting.

8. Menguji Robots.txt

Gunakan alat pengujian robots.txt yang disediakan oleh Google di Google Search Console untuk memastikan file Anda bekerja seperti yang diharapkan.

Periksa apakah ada kesalahan atau peringatan.

9. Monitoring dan Pembaruan

Secara berkala periksa dan perbarui robots.txt Anda sesuai kebutuhan.

Pastikan file tetap relevan dengan struktur situs dan kebijakan SEO Anda.

Ingatlah bahwa robots.txt adalah petunjuk dan bukan penegakan yang ketat. Bot tertentu mungkin memilih untuk mengabaikan aturan yang Anda tetapkan. Selalu pastikan bahwa informasi sensitif di situs web Anda dilindungi dengan cara lain selain hanya mengandalkan robots.txt.

Daftar Nama Good Robots (GoodBot)

Memilih bot yang diizinkan mengakses situs web Anda bergantung pada kebutuhan SEO dan manajemen konten Anda. Berikut adalah beberapa bot utama yang direkomendasikan untuk diizinkan karena mereka berperan penting dalam indeksasi dan SEO:

  1. Googlebot: Ini adalah bot crawling utama Google. Mengizinkan Googlebot memastikan bahwa konten situs Anda diindeks dan muncul dalam hasil pencarian Google.
  2. Bingbot: Bot ini digunakan oleh mesin pencari Microsoft Bing. Mengizinkan Bingbot membantu situs Anda tampil dalam hasil pencarian Bing.
  3. Yahoo! Slurp: Meskipun Yahoo sekarang menggunakan Bing untuk hasil pencarian, mereka masih memiliki bot sendiri, dan mengizinkannya bisa bermanfaat.
  4. DuckDuckBot: Bot dari DuckDuckGo, mesin pencari yang menekankan privasi. Mengizinkannya membantu situs Anda diindeks oleh DuckDuckGo.
  5. Baiduspider: Jika audiens target Anda termasuk pengguna di China, mengizinkan bot ini penting karena Baidu adalah mesin pencari terkemuka di China.
  6. YandexBot: Bagi mereka yang menargetkan pasar Rusia, Yandex adalah mesin pencari utama di sana, sehingga mengizinkan YandexBot sangat penting.
  7. Sogou Spider: Bot lain yang penting untuk pasar China, dari mesin pencari Sogou.
  8. Exabot: Bot ini digunakan oleh Exalead, mesin pencari yang berbasis di Eropa.
  9. Facebook External Hit: Meskipun bukan mesin pencari, bot ini digunakan oleh Facebook untuk mengambil pratinjau tautan yang dibagikan di platformnya.
  10. Twitterbot: Mirip dengan Facebook, Twitter menggunakan bot ini untuk mengambil data untuk pratinjau tautan yang dibagikan di Twitter.

Selalu pastikan bahwa file robots.txt Anda dikonfigurasi dengan benar untuk mengizinkan bot ini jika mereka sesuai dengan strategi SEO dan target audiens Anda. Ini akan memastikan bahwa situs web Anda diindeks dengan baik oleh mesin pencari utama dan platform media sosial.

Cakupan Layanan

Desain UI/UX, Pengembangan backend, frontend & integrasi API/REST API.

Web development berbasis PHP, Nextjs, Nodejs didalam berbagai stack pilihan yang sesuai dengan kebutuhan Anda.

Full-stack Web Developer

2009 sampai sekarang berpengalaman dalam pengembangan web dan solusi digital.

Memulai sebagai praktisi search engine optimization (SEO) dengan brand JBS Group dapat dibuktikan dengan: Fakta I, Fakta II, Fakta III. Terus melakukan inovasi dan pengembangan dalam bidang digital.

Ruang Lingkup Pekerjaan

Sebaran Klien BudiHaryono.id

Scope klien yang kami tangani 80% terkait dengan SEO, website company profile. 10% Klien terkait dengan pengembangan aplikasi seperti pengembangan SAAS dan web aplikasi untuk kebutuhan kantor. 5% Klien terkait dengan layanan IT Solution seperti: IT infastruktur, IT networking & IT Outsourcing. 5% Klien terkait dengan layanan Maintenance.

80%
SEO & Website Company Profile
10%
Pengembangan Aplikasi
5%
IT Solution
5%
Maintenance

Platform & Arsitektur

Aplikasi yang kami bangun.

Platform, arsitektur yang kami gunakan meliputi: WordPress, Laravel, Shopify, Next.js, React, PHP.

90%
WordPress
10%
Lainnya

Jasa Web Developer Full-stack | BudiHaryono.id

Membangun web, app, SAAS dengan strategi, bukan sekadar mengikuti tren yang belum tentu menghasilkan.

2009
Mulai 2009 bekerja menjadi web devoper.
17+
Bekerja lebih dari 17 tahun berpengalaman dibidangnya.
200+
Lebih dari 200 proyek terselesaikan.
10+
Lebih dari 10 korporate klien aktif.

Worskshop BudiHaryono.id

Bekerja secara remote. Full-time menyelesaikan project sampai selesai.

BudiHaryono.id adalah jasa web developer full-stack freelance profesional dan berpengalaman.

  • Alamat Jl. Mujahidin 1 No.112, RT/RW 002/008. Kreo Selatan, Larangan, Kota Tangerang, Banten, 15156, Indonesia.
  • Telepon: 0813-9891-2341
Workshop BudiHaryono.id

Scope (ruang lingkup) penawaran Kami

Siap membantu mencapai keberhasilan seperti ekspektasi Anda.

Stacks, platforms, infrastruktur yang kami kuasai untuk memberikan hasil yang maksimal. BudiHaryono adalah full-stack web developer. Jasa Pembuatan Website, Maintenance Website, Web Company Profile, Jasa Pembuatan Website WordPress, Jasa Pembuatan Landing Page, Jasa Pembuatan Aplikasi Website, Jasa Fotografer Produk, Jasa Videografi, dan Jasa Pembuatan Video Company Profile

  • Android App
  • Animasi Web
  • API Design
  • API Rest
  • App Mobile
  • App Testing
  • Backend Dev
  • Bootstrap CSS
  • Brand Photo
  • Bug Fix
  • CMS Custom
  • CodeIgniter
  • Color Grade
  • Company Video
  • Content Photo
  • Custom Hook
  • Custom Plugin
  • Custom Theme
  • Dashboard UI
  • Database
  • Deploy App
  • Docker
  • Domain Setup
  • Drone Shot
  • E-Commerce
  • Edit Photo
  • Edit Video
  • Figma UI
  • Food Photo
  • Form Builder
  • Frontend Dev
  • Full Stack
  • Git Flow
  • GraphQL
  • Headless CMS
  • Headshot
  • Hosting Setup
  • IT Support
  • IT Outsource
  • IT Infrastruktur
  • iOS App
  • JavaScript
  • Joomla Dev
  • jQuery
  • Landing Page
  • Laravel Dev
  • Load Speed
  • Logo Design
  • Maintenance
  • Mobile App
  • Mobile Web
  • Motion Graphic
  • MySQL DB
  • Next.js
  • Node.js
  • On-Page SEO
  • Page Builder
  • PHP Dev
  • Plugin Dev
  • Podcast Video
  • Portfolio Web
  • PWA Dev
  • React Dev
  • Redis Cache
  • Redesign Web
  • Reel Video
  • REST API
  • Responsive
  • Schema Markup
  • SEO Teknis
  • Server Side
  • Sitemap XML
  • SSL Setup
  • Studio Foto
  • Tailwind CSS
  • Theme Dev
  • TypeScript
  • UI Design
  • UX Research
  • Video Profil
  • Vue.js
  • Web Audit
  • Web Design
  • Web Dev
  • WebFlow
  • WooCommerce
  • WordPress Dev
  • XML Sitemap

Klien & Partner Kami

Perusahaan, UMKM & Individual yang menggunakan jasa kami & Tim

Selain pengembangan web kami juga menangani IT solutions (infrastruktur, it support outsourcing) dll.

  • 99.Co
  • AET Travel
  • Alpha Filter Indonesia
  • Belanjah Mamah
  • Diklat Gada Pratama
  • Evania Residence
  • Fajarmerah
  • Fajarmerah Collection
  • Garda Total Securindo
  • Gestun ITC BSD
  • IDHub
  • ID Outsourcing
  • Imtri Jaya Interior
  • Indo Oustsourcing
  • Izzatishot Creative
  • Jasa Cuci Toren Air
  • Juragan Grooming
  • Kopi Kenangan
  • Leo Siregar
  • LQ Law Firm
  • Neviaffan Travel
  • Newland FA
  • Outsourcing
  • Outsourcingindo
  • Paket Firstmedia
  • Paket XL Satu
  • Pengacara Perceraian
  • Pintu Besi Kens
  • PT. ASP
  • PT. BNI ( Divisi DPLK )
  • PT. Buana Merdeka Jaya
  • PT. FISS
  • PT. GPP Sejahtera
  • PT. GTS
  • PT. HPM Group
  • PT. KCS
  • PT. Phytochemindo Reksa
  • PT. Samco Farma
  • PT. SAS Security
  • PT. SKM
  • PT. Union Abadi Makmur
  • PT Bahana Inti Sejahtera
  • PT Fisssecurity
  • PT Inter Sistem Asia
  • PT Kenko
  • PT MKI
  • Pusat Khitan
  • Reqspace
  • Service Center Wika
  • Sewa Standing AC
  • Smartschool Al-Haamidiyah
  • Solahart Service Center
  • Supplier TD
  • Toko Timbangan
  • Total Buah Segar
  • WRK & Partners
  • XL Satu