چگونه نقشه سایت را به فایل Robots.txt اضافه کنیم؟

نقشه سایت درواقع لیست تمام صفحات سایت شمارا شامل میشود و گنجاندن آن در robots.txt میتواند باعث شود که سایت شما خیلی سریعتر و راحتتر توسط موتورهای جستجو پیدا شود. انجام این کار بسیار ساده اما ملزم رعایت نکاتی است که میخواهیم در چند مرحله ساده آنها را با شما در میان بگذاریم.
اگر یک وبمستر یا یک توسعهگر وبسایت هستید، قطعاً میخواهید که سایتتان در میان نتایج جستجو دیده شود. برای اینکه در میان نتایج موتورهای جستجو نشان داده شوید باید باتهای موتور جستجو در وبسایت شما و صفحات مختلف آن بخزند و آنها را فهرست کنند.
در حوزه فنی وبسایت، دو فایل مختلف وجود دارد که به باتها در یافتن آنچه لازم دارند کمک میکنند:
- Robots.txt
- نقشه سایت
Robots.txt و نقشه سایت
Robots.txt یک فایل متنی ساده است که در دایرکتوری اصلی سایت شما قرار دارد. این همان فایل وبسایت شماست که به رباتهای موتور جستجو میگوید در چه قسمتهایی از سایت شما بخزند و در کدامیک جستجو نکنند. همچنین شامل دستورهایی است که مشخص میکند کدام رباتهای موتور جستجو اجازه این دسترسی و جستجو را دارند و کدامیک ندارند.
باتهای جستجو معمولاً بهمحض ورود به یک سایت، به دنبال فایل robots.txt میگردند. به همین دلیل است که داشتن یک فایل robots.txt بسیار مهم است. حتی اگر هم بخواهید که تمام رباتهای جستجو در تمام صفحات سایتی که دارید بخزند، داشتن یک فایل پیشفرض robots.txt که این امکان را بدهد ضروری است.
همچنین یک فایل robots.txt اطلاعات مهمی درباره نقشه سایت را شامل میشود. در اینجا قصد داریم بهتفصیل به این ویژگی robots.txt بپردازیم. اما قبل از آن اجازه دهید ببینیم یک نقشه سایت چیست و چرا اهمیت دارد.
نقشه سایت، یک فایل XML است که شامل لیستی از تمام صفحات موجود در سایت شماست. همچنین میتواند شامل اطلاعات بیشتری درباره هر URL در قالب یک Meta data باشد. و همچون robots.txt، داشتن نقشه سایت هم امری ضروری است. این فایل به باتهای موتور جستجو در جستجو، خزیدن و فهرست کردن تمام صفحات یک سایت از طریق نقشه سایت کمک میکند.
Robots.txt و نقشه سایت چه ارتباطی باهم دارند؟
در سال ۲۰۰۶ بود که یاهو، مایکروسافت و گوگل دست در دست هم گذاشتند تا از پروتکل استاندارد شدهای برای ثبت صفحات در یک سایت بهوسیله نقشه سایت پشتیبانی کنند. برای این کار میبایست نقشه سایت خود را از طریق Google webmaster tools، Bing webmaster tools و yahoo ثبت میکردید، درحالیکه برخی موتورهای جستجوی دیگر مانند DuckDuckGoGo نیز از نتایج بهدستآمده از Bing و Yahoo استفاده میکنند.
حدود ۶ ماه بعد، یعنی در ماه آوریل ۲۰۰۷، آنها در پشتیبانی از سیستمی برای یافتن نقشه سایت از طریق robots.txt به هم ملحق شدند که شناسایی خودکار نقشههای سایت نام داشت. این موضوع یعنی حتی اگر نقشه سایت خود را در موتورهای جستجوی فردی ثبت میکردید مشکلی وجود نداشت. آنها میتوانستند ابتدای کار، محل نقشه سایت را از فایل robots.txt سایت شما به دست آورند.
(تذکر: این درحالیکه است که هنوز هم ثبت نقشه سایت روی اکثر موتورهای جستجو که امکان ثبت URL را دارند انجام میشود).
و به همین دلیل بود که اهمیت فایل robots.txt برای وبمسترها بیشتر هم شد چون بهراحتی میتوانستند راه را برای باتهای جستجو باز کنند تا تمام صفحات وبسایتشان را بررسی کنند.
چطور یک فایل Robots.txt حاوی موقعیت نقشه سایت بسازیم؟
در اینجا سه مرحله آسان برای ساخت یک فایل robots.txt حاوی موقعیت نقشه سایت را برایتان شرح میدهیم:
گام اول: تعیین URL نقشه سایت
اگر وبسایت شما توسط یک توسعه گر ساختهشده است، بهتر است اول از آنها بپرسید که آیا نقشه سایت برای وبسایتتان فراهم کردهاند یا خیر. URL مربوط به نقشه سایت معمولاً چنین شکلی دارد: http://www.example.com/sitemap.xml
پس کافی است این URL را در نوار آدرس مرورگر خود بنویسید و بجای عبارت example، دامین سایت را وارد کنید.
مقاله مرتبط: چگونه نقشه وب سایت بسازیم؟
همچنین میتوانید محل نقشه سایت خود را به کمک جستجوی گوگل و استفاده از موتورهای جستجو همانند اشکال زیر تعیین کنید:
site:example.com filetype:xml
و یا
filetype:xml site:example.com inurl:sitemap
اما این روش تنها در صورتی جواب میدهد که سایتتان قبلاً توسط گوگل بررسی و فهرست شده باشد.
اگر هیچ نقشه سایتی در سایت خود پیدا نکردید، میتوانید خودتان با استفاده از ابزار ساخت نقشه سایت، یا دنبال کردن روش توضیح دادهشده در Sitemaps.org یک نقشه سایت بسازید.
گام دوم: فایل Robots.txt خود را پیدا کنید
برای تشخیص اینکه آیا سایتتان فایل robots.txt دارد یا خیر، میتوانید عبارت example.com/robots.txt را تایپ کنید.
اگر فایل robots.txt نداشته باشید، مجبور خواهید شد که آن را بسازید و در بالاترین دایرکتوری سرور وب خود (دایرکتوری اصلی) اضافه کنید. برای اینکار به دسترسی وب سرور خود نیز احتیاج خواهید داشت. این فایل معمولاً در همان محلی که “index.html” اصلی سایتتان است، قرار دارد. محل این فایلها به نوع نرمافزار وب سروری که دارید بستگی دارد. اگر با این فایلها آشنا نیستید حتماً از یک توسعه گر وب کمک بگیرید.
فقط به یاد داشته باشید که برای اسم فایلی که محتوای robots.txt شمارا شامل میشود از حروف کوچک استفاده کنید. اسم فایل را مانند Robots.TXT یا Robots.Txt انتخاب نکنید.
گام سوم: اضافه کردن موقعیت نقشه سایت به فایل robots.txt
اکنون فایل robots.txt را در دایرکتوری اصلی سایت بازکنید. اینجا هم دوباره به دسترسی به سرور وب خود احتیاج دارید. پس اگر نمیدانید فایل robots.txt سایت خود را چطور پیدا و بازکنید، بهتر از یک توسعه گر وب بخواهید این کار را برایتان انجام دهد.
برای تسهیل پیدا کردن خودکار نقشه سایت شما از طریق robots.txt، تمامکاری که لازم است انجام دهید این است که همانند شکل زیر یک دستور را همراه با URL موردنظر در robots.txt قرار دهید:
Sitemap: http://www.example.com/sitemap.xml
درنتیجه فایل robots.txt به این شکل خواهد بود:
Sitemap: http://www.example.com/sitemap.xml User-agent:* Disallow:
تذکر: دستوری که حاوی موقعیت نقشه سایت است را میتوانید در هر جای فایل robots.txt قرار دهید. این دستور از خط دستور user-agent مستقل است، درنتیجه فرقی نمیکند کجا قرار بگیرد.
اگر چند نقشه سایت داشتید چطور؟
هر نقشه سایت نمیتواند بیش از ۵۰۰۰ URL داشته باشد. پس در مورد سایتهای بزرگتر که URL های فراوانی دارد، میتوانید چند فایل نقشه سایت بسازید. باید موقعیت این چند فایل نقشه سایت را در یک فایل فهرست نقشه سایت بگذارید. فرمت XML فایل sitemap index مشابه فایل نقشه سایت است، یعنی درواقع یک نقشه سایت مربوط به نقشههای سایت است.
وقتی چند نقشه سایت دارید، میتوانید URL مربوط به فایل فهرست نقشههای سایت را همانند مثال زیر در فایل robots.txt قرار دهید:
Sitemap: http://www.example.com/sitemap_index.xml User-agent:* Disallow
و یا میتوانید تکتک URL های چند فایل نقشه سایتی که دارید را مشخص کنید، همانند شکل زیر:
Sitemap: http://www.example.com/sitemap\_host1.xml Sitemap: http://www.example.com/sitemap_host2.xml User-agent:* Disallow
در انتها باید در هنگام اضافه کردن دستور نقشه سایت به فایل robots.txt به یک موضوع توجه کنید.
بهطورکلی توصیه میشود که همیشه دستور فرعی ‘Sitemap’ را در کنار URL نقشه سایت در فایل robots.txt قرار دهید. اما در برخی موارد مشاهدهشده است که این کار باعث بروز خطاهایی میشود. میتوانید حدود یک هفته بعدازاینکه فایل robots.txt را بهروزرسانی کردید و موقعیت نقشه سایت را در آن قرار دادید، برای بررسی وجود چنین خطاهایی از ابزار Google Webmaster tools استفاده کنید.
برای جلوگیری از بروز این خطا، توصیه میشود که بعد از URL نقشه سایت یک خط را خالی بگذارید.
امیدواریم توانسته باشیم شمارا در ساخت یک فایل robots.txt حاوی موقعیت نقشه سایت راهنمایی کرده باشیم. با انجام این کار کمک بزرگی در حق سایت خودکردهاید!
سلام. وقتتون بخیر باشه. در سرچ کنسول، قسمت sitemaps در status کلمه couldn’t fetch را نوشته و وقتی به فایل robots سایت نگاه کردم دیدم :
User-agent : Googlebot در دستورات نیست و اضافه کردم.
بنظرتون مشکل از این موضوع می تونه باشه؟ چون URL سایت مپ سایتمم نمیاره و ۴۰۴ میده. و آیا نوشتن URL سایت مپ در فایل robots اجباری هست ؟
دستوراتی که در فایل robots از قبل بود :
User-agent: MJ12bot
Disallow: /
User-agent: AhrefsBot
Disallow: /
User-agent: msnbot
Disallow: /
User-agent: amazonbot
Disallow: /
User-agent: bingbot
Disallow: /
User-agent: YandexBot
Disallow: /
سلام، وقت شما هم بخیر.
ارور “couldn’t fetch” در بخش Sitemaps سرچ کنسول معمولاً به یکی از این مشکلات مربوط میشود:
۱️⃣ وجود خطا در فایل robots.txt
۲️⃣ دسترسی نداشتن گوگل به سایت مپ
۳️⃣ اشکال در URL سایت مپ (خطای ۴۰۴)
۴️⃣ مشکلات هاست و سرور
۱. مشکل User-agent در فایل robots.txt
اگر در فایل robots.txt، گوگلبات (Googlebot) مشخص نشده باشد، مشکلی ایجاد نمیشود، اما برای اطمینان میتوانید این خط را اضافه کنید:
User-agent: Googlebot
Allow: /
اما مشکل اصلی احتمالاً این نیست.
بودن آدرس سایت مپ در فایل robots.txt
📌 نوشتن URL سایت مپ در فایل robots.txt اجباری نیست، اما توصیه میشود.
برای اضافه کردن سایتمپ به robots.txt، این خط را انتهای فایل اضافه کنید:
Sitemap: https://yourdomain.com/sitemap.xml
بررسی آدرس سایت مپ و مشکل ۴۰۴
🔹 اگر وقتی https://yourdomain.com/sitemap.xml را باز میکنید خطای ۴۰۴ دریافت میکنید، یعنی یکی از مشکلات زیر وجود دارد:
✅ الف) سایتمپ ساخته نشده است:
📌 اگر از وردپرس استفاده میکنید، افزونه Yoast SEO یا Rank Math را نصب کنید تا سایتمپ ایجاد شود.
📌 اگر از CMS اختصاصی یا فریمورک (مثل Laravel) استفاده میکنید، بررسی کنید که مسیر سایتمپ درست باشد.
بررسی لاگهای هاست و دسترسیهای سرور
📌 اگر سرور شما دسترسی روباتهای گوگل را مسدود کرده باشد، این ارور ممکن است ایجاد شود.
📌 در Cpanel یا DirectAdmin بخش Error Logs یا Access Logs را بررسی کنید و ببینید آیا گوگلبات به /sitemap.xml دسترسی دارد یا خیر.