it-swarm.dev

أداة جيدة للزحف إلى موقعي ومساعدتي في العثور على رابط ميت وملفات غير مرتبطة

لدي موقع قديم كبير جدًا يحتوي على الآلاف من ملفات PDF التي يتم حسابها في بعض الأحيان في قاعدة بيانات ، ولكنها غالبًا ما تكون مجرد روابط على الصفحة ، ويتم تخزينها في معظم كل دليل على الموقع.

لقد كتبت برنامج تتبع ارتباطات php لمتابعة جميع الارتباطات الموجودة على موقعي ، ثم أقارن ذلك مقابل تفريغ بنية الدليل ، ولكن هل هناك شيء أسهل؟

21
MrChrister

لقد استخدمت Xenu's Link Sleuth . أنها تعمل بشكل جيد ، فقط تأكد من عدم DOS نفسك!

15
plntxt

إذا كنت تستخدم windows 7 ، فأفضل أداة هي SEO Toolkit 1.0 الخاصة بـ IIS7. إنه مجاني ويمكنك تنزيله مجانًا.

ستقوم الأداة بفحص أي موقع وإخبارك بمكان وجود جميع الروابط الميتة ، والصفحات التي تستغرق وقتًا طويلاً لتحميلها ، والصفحات التي تحتوي على عناوين مفقودة ، وعناوين مكررة ، والكلمات الرئيسية والأوصاف ، والصفحات التي كسرت HTML.

6
Ben Hoffman

جرب أداة مدقق الرابط المفتوح W3C . يمكنك استخدامه عبر الإنترنت أو تثبيته محليًا

4
mvark

هناك العديد من المنتجات من Microsys ، خاصة --- A1 Sitemap Generator و A1 Website Analyzer التي ستزحف إلى موقعك وتبلغ عن كل شيء يمكنك تخيله حول ذلك.

يتضمن ذلك الارتباطات المعطلة ، ولكن أيضًا عرض جدول لجميع صفحاتك حتى تتمكن من مقارنة أشياء مثل <title> وعلامات وصف meta المتماثلة ، والروابط nofollow ، و meta noindex على صفحات الويب ، والكثير من الأمراض التي تحتاج فقط إلى عين حادة و يد سريعة لإصلاح.

1
Evgeny

رابط ممتحن هي مجانية جيدة حقا جدا لحاجتك.

1
Dark

أنا معجب كبير بـ linklint من أجل التحقق من المواقع الثابتة الكبيرة ، إذا كان لديك سطر أوامر حول نظام يونيكس (I ') لقد تم استخدامها في نظام التشغيل Linux و MacOS و FreeBSD). انظر موقعهم للحصول على تعليمات التثبيت. بمجرد التثبيت ، أقوم بإنشاء ملف يسمى _check.ll_ وقم بما يلي:

_linklint @check.ll
_

إليك ما يبدو عليه ملف check.ll

_# linklint
-doc .
-delay 0
-http
-htmlonly
-limit 4000
-net
-Host www.example.com
-timeout 10
_

يؤدي ذلك إلى تتبع ارتباطات _www.example.com_ وإنشاء ملفات HTML مع تقارير مرجعية لما تم كسره أو فقده ، إلخ.

1
artlung