HTTrack ile herhangi bir web sitesi nasıl klonlanır

İçindekiler

HTTrack, amacı web yakalama olan ücretsiz ve ücretsiz ve çok platformlu bir yazılımdır, yani bir web sitesinin tamamı veya bir kısmı daha sonra çevrimdışı gezinebilmek için indirilir. adında bir Linux sürümü var. WebHTTrack, ve Windows için sürümü denir WinHTTrack. HTTrack yazılımını resmi web sitesinden indirebiliriz:

Linux durumunda, aşağıdaki komutu kullanarak onu depolardan da kurabiliriz.

 sudo apt-get install httrack

Bu yazılım web sitelerini kopyalamak için çok kullanılır ve sonra bunları başka bir sunucuya yükleyin ve trafiği kopya sayfasına yönlendirmek için kullanın, ziyaretçileri sahte bir sayfaya gönderin. Ayrıca belirli bir web sitesinin kodunu veya işleyişini görmek isteyenler tarafından da kullanılır. Uygulamanın barındırıldığı httrack.com web sitesi ile bir örneğe bakalım.

 httrack "httrack.com"
Bu komut, dosyaları web'den bir klasöre indirecektir. www.httrack.com, yerel olarak görebiliyoruz.

HTTrack herhangi bir web sitesini alır ve konumlandığımız klasörde veya sürücüde bir kopyasını oluşturur. Bu, web sitesinde çevrimdışı olarak e-posta adresleri, seo için yararlı bilgiler veya bir web sitesinin yapısı gibi verileri ararken faydalı olabilir. HTTrack hem Windows'ta hem de Linux için bir sürümde gelir ve kullanım yalnızca Windows'ta görsel intergaz'a sahip olmasıyla aynıdır.

Yapabiliriz sızma testi ve güvenlik testi için Httrack kullanın, çünkü bir web sitesinin bir kopyasını oluştururken, bir saldırgan tarafından kritik bir dosyanın görülmediğini belirlemek için tüm içeriğin ve hangi dosyaların indirildiğinin analiz edilmesine olanak tanır. Veri ve bilgi topladığımızda testler yapabilir, kod veya anahtar kelimeleri arayabilir ve analiz edebilir, daha sonra kullanılabilecek verileri de toplayabiliriz.

Ben de bu şekildebilgisayar korsanları, bir sunucuya yüklemek için yapılan kopyaları kullanır web sitelerini taklit etmek için kopyalanan web benzeri bir alan adı ile ve daha sonra bunları, şüpheli olmayan kullanıcılardan veri çalmak veya sosyal mühendislik saldırıları gerçekleştirmek için kimlik avı yoluyla kullanın. Httrack, bu komut için indirmeyi iyileştirmek için kullanılacak birçok seçenek ve parametreye sahiptir:

 httrack -- yardım

Httrack aracıyla kullanabileceğimiz bazı önemli parametreler şunlardır:

  • -m: indirilecek bayt cinsinden maksimum dosya boyutunu belirtir, örneğin -m 20000000 20 mb'ye eşdeğer.
  • -mim: yalnızca uzantısıyla belirteceğimiz belirli bir dosya türünü indirmek için kullanılır, örneğin komutla
 httrack www.WEB.com -mime: uygulama / * + mime: uygulama / pdf
httrack'i kullanmak basittir, kopyalamak istediğimiz web sitesinin etki alanını eklemeli ve ardından taramayı başlatmalıyız. sabit diskimizde web sitesini depolayacağımız bir dizine yerleştirilir. İndirilecek bilgi miktarı nedeniyle bir web sitesinin sahip olabileceği bağlantı veya içerik sayısını dikkate almalıyız. Web'in kopyasını keşfetmek, göz atmayı riske atabilecek kusurları ve güvenlik açıklarını aramak ve ayrıca hangi bölümleri şifrelemenin veya güvenliği artırmanın uygun olduğunu belirlemek için kullanılabilir.

İndirmenin amacı, bir şirket veya kullanıcı listeleri, telefonlar veya özellikle sosyal mühendislik için diğer veriler hakkında bilgi bulmak veya bir web sitesini veya kullanıcı verilerini elde etmek için bir oturum açmayı denemekse, HTTrack her iki görev için de mükemmel bir araçtır.

WebHTTrack ile Grafik Arayüz
WebHTTrack, bir web tarayıcısından kullanılan httrack için grafiksel bir arayüzdür. ve çevrimdışı erişim için tüm web sitelerinin kopyalarına izin verir ve bağlantıları otomatik olarak değiştirir. WebHTTrack gibi araçlar yardımcı olabilir ve bir web sitesini ve içeriğini indirmek veya kopyalamak için parametreleri hatırlamak zorunda kalmadan kopyanın güncellenmesine izin verebilir. Şu komutla kurabiliriz:

 sudo apt-get install webhttrack
sonra çalıştır aynı komutu yazacağız:
 webhttrack
NS grafik arayüzünü başlat, doğrudan uygulamalar menüsünden gidebiliriz ve Yansıtılmış Web Sitelerine Gözat uygulamasını arıyoruz.

Diğer bir seçenek ise basitçe, daha önce terminal penceresinden söylediğimiz gibi, 8080 portunda yerel bir web sunucusu başlatmak için webhttrack komutunu yazıp, gizli veya özel modda olmadığını dikkate alarak tarayıcıyı açıyoruz ve tarayıcıda localhost adresini yazıyoruz: 8080.

Bu bize httrack ile çalışmamıza yardımcı olacak grafik sihirbazını gösterecek, başlamak için dili yapılandırmamız ve İleri'ye tıklamamız gerekecek. Daha sonra Yeni bir Proje yapılandıracağız, grafik arayüze sahip olmanın avantajı, indirilen web sitelerinin verilerini ve bir metin dosyasında kullanılan parametreleri kaydedebilmemizdir.

Ardından kopyalayacağımız web sitesini atayacağız:

Ardından, Seçenekleri Tanımla'da bir sihirbaz aracılığıyla parametreleri ve filtreleri yapılandıracağız:

Ardından filtreleri yapılandırdıktan sonra bir sonraki ekranda taramaya başlayacağız.

Httrack kullanmanın dezavantajlarıBir web sitesinden bu tür tarama ve indirme yapmak için Httrack aracını kullanmanın aşağıdaki gibi bazı dezavantajları vardır:

  • Dinamik içeriği veya komut dosyası içeren sayfaları yakalamaz.
  • Çok büyük veya büyük dosyalar içeren siteleri indirmek sunucunun çökmesine neden olabilir.
  • Aynı web sitesine çok fazla eşzamanlı bağlantıda httrack kullanırsak, sunucuyu yavaşlatabilir veya hizmet dışı bırakabiliriz.

Bağlantıları izlemek için bir kodun yapıldığı öğretici ilginizi çekebilir:

Python ile web bağlantılarını izleyin

Bu Eğitimi beğendiniz ve yardım ettiniz mi?Yazara olumlu puan vermek için bu düğmeye basarak yazarı ödüllendirebilirsiniz.

Arkadaşlarınızla sayfasını paylaşan sitenin gelişimine yardımcı olacak

wave wave wave wave wave