İşletim sistemleri, aramaları, yönetim eylemlerini, desteği ve çok daha fazlasını gerçekleştirerek dağıtım yeteneklerini artırmak için bize birden çok seçenek sunan komut satırlarına dayanmaktadır.
Tam olarak bu seçeneklerden biri, Linux'ta belirli dosya türlerini arama ve böylece içeriklerine kolayca erişme olasılığı ile bağlantılıdır ve bu nedenle bugün PDF dosyalarını aramaya odaklanan pdfgrep hakkında konuşacağız.
pdfgrep nedirPdfgrep, PDF dosyalarında basit ve işlevsel bir şekilde metin aramak için bir komut satırı yardımcı programıdır, bu da bize her dosyaya erişmekten ve PDF araçlarıyla metni aramaktan zaman kazandırır.
Bazı özellikleri şunlardır:
- Grep ile uyumlu olarak -r, -i, -n veya -c gibi birçok grep parametresini çalıştırabiliriz.
- Birden çok PDF dosyasında metin arama yeteneği
- Öne Çıkan Renkler, bu GNU Grep renk seçeneği varsayılan olarak desteklenir ve etkinleştirilir.
- Düzenli ifadelerin kullanımını destekler.
- Ücretsiz yazılım
1. Pdfgrep'i Linux'a yükleyin
Aşama 1
Bu durumda, aşağıdaki satırı çalıştırmanın yeterli olduğu Ubuntu'yu kullanacağız. Paketlerin indirilmesini ve kurulmasını kabul etmek için S harfini giriyoruz.
sudo apt kurulum pdfgrep
Adım 2
Diğer kurulum seçenekleri şunlardır:
- .TAR.GZ dosyasını aşağıdaki bağlantıdan indirin.
Aşama 3
- Veya aşağıdaki komutu çalıştırın:
git klonu https://gitlab.com/pdfgrep/pdfgrep.git4. Adım
Ardından, aşağıdaki satırların her birini sırayla girin:
./configure make sudo make install
2. Linux'ta Pdfgrep kullanın
Aşama 1
pdfgrep yüklendikten sonra bu, kullanılacak sözdizimi olacaktır:
pdfgrep [SEÇENEK…] DESEN [DOSYA]Adım 2
Öğelerin her biri:
- Seçenek: Aramaya ekleyebileceğimiz öznitelikleri belirtir, örneğin -ben veya --ignore-case, belirttiğimiz kalıp ile dosyayla eşleşmesi gereken kalıp arasındaki büyük ve küçük harf ayrımını yok sayar.
- Model: Genişletilmiş bir normal ifadeyi belirtir.
- Dosya: Aramanın yapılması gereken PDF dosyasıdır.
Aşama 3
Basit bir arama ile başlayacağız, örneğin Solvetic.pdf dosyasında Solvetic kelimesini arayacağız, bunun için aşağıdakileri yürütüyoruz:
pdfgrep Solvetik Solvetic.pdf
BÜYÜT
4. Adım
Bu durumda, bu terim söz konusu dosyada yalnızca bir kez bulunur, ancak şimdi resmi bir Microsoft PDF dosyasında Windows terimini arayacağız ve göreceğimiz sonuç bu olacaktır:
BÜYÜT
Adım 5
Aranan kelimenin vurgulandığını ve konumunu kolaylaştırdığını görebiliriz. Şimdi parametreyi eklersek -içinde, Bu terimin tespit edildiği sayfa numarası ile sonuçları görmek mümkün olacaktır:
BÜYÜT
6. Adım
pdfgrep ile kullanabileceğimiz diğer bir seçenek de belirli bir terimi içeren PDF dosyalarını listelemektir, bunun için aşağıdakileri uygularız:
pdfgrep Çözücü * pdf7. Adım
Bu şekilde Solvetic terimini içeren PDF dosyası listelenecektir:
BÜYÜT
8. Adım
PDF dosyasını açmak istiyorsak aşağıdaki komutu uygulayabiliriz:
xdg-open (Dosya.PDF)
BÜYÜT
9. Adım
pdfgrep'in bize sunduğu genel seçenekler şunlardır:
-i, --ignore-caseHem kaynak hem de girdi dosyalarındaki büyük/küçük harf ayrımlarını yok sayın.
-F, --sabit-dizelerPATTERN öğesini yeni satırlarla ayrılmış sabit dizelerin bir listesi olarak yorumlar.
--önbellekBüyük dosyalarda işlemi hızlandırmak için işlenen metin için bir önbellek kullanın.
-P, --perl-regexpPATTERN'i Perl uyumlu bir normal ifade (PCRE) olarak yorumlar.
-H, --dosya adıylaHer eşleşme için dosya adını yazdırın.
-h, --no-dosya adıÇıktıdaki dosya adı önekini gizler.
-n, --sayfa numarasıHer eşleşmenin önüne arama teriminin bulunduğu sayfanın numarasını ekleyin.
-c, --sayNormal çıktıyı bastırır ve bunun yerine her girdi dosyası için eşleşme sayısını yazdırır.
-p, --sayfa sayısıSayfa başına eşleşme sayısını yazdırın. -n anlamına gelir.
--RenkDosya adlarını, sayfa numaralarını ve farklı dizilimlerle eşleşen metinleri terminalde renkli olarak görüntülemek için vurgulamaya izin verir, seçeneklerinden bazıları Her Zaman, ense veya otomatiktir.
-o, --sadece-eşleşenÇevreleyen bağlam olmadan yalnızca bir satırın eşleşen kısmını yazdırın.
-r, --özyinelemeliSembolik bağlantıları yalnızca komut satırındaysa takip ederek, her bir dizinin altındaki tüm dosyaları (--include ve --exclude ile kısıtlanmış) yinelemeli olarak aramamıza olanak tanır.
-R, --recursive-referans-r ile aynıdır, ancak tüm sembolik bağları takip eder.
-sessiz veya -qUygulamadan çıkmamızı sağlar.
Bu pdfgrep ile Linux ortamlarında PDF dosyalarıyla çalışırken ideal bir çözüm haline gelir.