5 geriausi įrankiai pasikartojantiems failams rasti ir ištrinti sistemoje „Linux“.


Sutvarkyti savo namų katalogą ar net sistemą gali būti ypač sunku, jei turite įprotį atsisiųsti įvairius dalykus iš interneto naudodami atsisiuntimo tvarkykles.

Dažnai galite pastebėti, kad atsisiuntėte tą patį mp3, pdf ir epub (ir visų kitų failų plėtinių) ir nukopijavote juos į skirtingus katalogus. Dėl to jūsų katalogai gali būti perkrauti visokiais nenaudingais pasikartojančiais dalykais.

Šiame vadove sužinosite, kaip rasti ir ištrinti pasikartojančius failus sistemoje „Linux“ naudojant komandų eilutės įrankius rdfind, fdupes ir rmlint , taip pat naudojant GUI įrankius, vadinamus DupeGuru ir FSlint.

Atsargiai – visada būkite atsargūs, ką ištrinate iš savo sistemos, nes tai gali sukelti nepageidaujamą duomenų praradimą. Jei naudojate naują įrankį, pirmiausia išbandykite jį bandomajame kataloge, kuriame failų ištrynimas nesukels problemų.

1. Rdfind – raskite pasikartojančius failus Linux sistemoje

Rdfind gaunama iš perteklinių duomenų radimo, kuris yra nemokamas komandų eilutės įrankis, naudojamas ieškant pasikartojančių failų keliuose kataloguose arba juose. Ji rekursyviai nuskaito katalogus ir identifikuoja identiško turinio failus, todėl galite imtis atitinkamų veiksmų, pvz., ištrinti arba perkelti dublikatus.

Rdfind naudoja algoritmą failams klasifikuoti ir nustato, kuris iš dublikatų yra originalus, o likusius laiko dublikatais.

Reitingavimo taisyklės yra šios:

  • Jei A buvo rastas nuskaitant įvesties argumentą anksčiau nei B, A reitingas yra aukštesnis.
  • Jei A buvo rastas mažesniame gylyje nei B, A reitingas yra aukštesnis.
  • Jei A buvo rasta anksčiau nei B, A reitingas yra aukštesnis.

Paskutinė taisyklė ypač naudojama, kai tame pačiame kataloge randami du failai.

Įdiekite „Rdfind“ sistemoje „Linux“.

Jei norite įdiegti rdfind sistemoje „Linux“, naudokite šią komandą pagal savo Linux platinimą.

sudo apt install rdfind         [On Debian, Ubuntu and Mint]
sudo yum install rdfind         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/rdfind  [On Gentoo Linux]
sudo apk add rdfind             [On Alpine Linux]
sudo pacman -S rdfind           [On Arch Linux]
sudo zypper install rdfind      [On OpenSUSE]    

Jei norite paleisti rdfind kataloge, tiesiog įveskite rdfind ir tikslinį katalogą.

rdfind /home/user

Kaip matote, rdfind išsaugos rezultatus faile, pavadintame results.txt, esančiame tame pačiame kataloge, iš kurio paleidote programą. Faile yra visi pasikartojantys failai, kuriuos rado „rdfind“. Jei norite, galite peržiūrėti failą ir pašalinti pasikartojančius failus rankiniu būdu.

Kitas dalykas, kurį galite padaryti, tai naudoti parinktį -dryrun, kuri pateiks dublikatų sąrašą neatlikus jokių veiksmų:

rdfind -dryrun true /home/user

Radę dublikatus galite pakeisti juos kietosiomis nuorodomis.

rdfind -makehardlinks true /home/user

Ir jei norite ištrinti dublikatus, galite paleisti.

rdfind -deleteduplicates true /home/user

Norėdami patikrinti kitas naudingas rdfind parinktis, galite naudoti rdfind vadovą.

man rdfind 

2. Fdupes – ieškokite pasikartojančių failų sistemoje Linux

Fdupes yra kita komandų eilutės programa, leidžianti nustatyti pasikartojančius failus jūsų sistemoje. Ji rekursyviai ieško katalogų, lygindama failų dydžius ir turinį, kad nustatytų dublikatus.

Pasikartojantiems failams nustatyti naudojami šie metodai:

  • Dalinių md5sum parašų palyginimas
  • Lyginant visus md5sum parašus
  • baitų palyginimo patikrinimas

Kaip ir rdfind, turi panašias parinktis:

  • Ieškokite rekursyviai
  • Išskirkite tuščius failus
  • Rodo pasikartojančių failų dydį
  • Nedelsdami ištrinkite dublikatus
  • Išskirkite failus su kitu savininku

Įdiekite „Fdupes“ sistemoje „Linux“.

Jei norite įdiegti fdupes sistemoje „Linux“, naudokite šią komandą pagal savo „Linux“ platinimą.

sudo apt install fdupes         [On Debian, Ubuntu and Mint]
sudo yum install fdupes         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/fdupes  [On Gentoo Linux]
sudo apk add fdupes             [On Alpine Linux]
sudo pacman -S fdupes           [On Arch Linux]
sudo zypper install fdupes      [On OpenSUSE]    

Fdupes sintaksė panaši į rdfind. Tiesiog įveskite komandą ir katalogą, kurį norite nuskaityti.

fdupes <dir>

Norėdami rekursyviai ieškoti failų, turėsite nurodyti -r tokią parinktį kaip ši.

fdupes -r <dir>

Taip pat galite nurodyti kelis katalogus ir nurodyti katalogį, kurio bus ieškoma rekursyviai.

fdupes <dir1> -r <dir2>

Norėdami, kad fdupes apskaičiuotų pasikartojančių failų dydį, naudokite parinktį -S.

fdupes -S <dir>

Norėdami surinkti apibendrintą informaciją apie rastus failus, naudokite parinktį -m.

fdupes -m <dir>

Galiausiai, jei norite ištrinti visus dublikatus, naudokite -d tokią parinktį kaip ši.

fdupes -d <dir>

Fdupes paklaus, kuriuos iš rastų failų ištrinti. Turėsite įvesti failo numerį:

Tikrai nerekomenduojamas sprendimas yra naudoti -N parinktį, kuri leis išsaugoti tik pirmąjį failą.

fdupes -dN <dir>

Norėdami gauti galimų su fdupes parinkčių sąrašą, peržiūrėkite pagalbos puslapį paleisdami.

fdupes -help

3. Rmlint – pašalinkite pasikartojančius failus

Rmlint yra komandų eilutės įrankis, naudojamas rasti ir pašalinti pasikartojančius ir į pūkelius panašius failus Linux sistemose. Tai padeda atpažinti identiško turinio failus, taip pat įvairių formų pertekliaus ar pūkelių, pvz., tuščius failus, neveikiančias simbolines nuorodas ir našlaičių failus.

Įdiekite „Rmlint“ sistemoje „Linux“.

Jei norite įdiegti Rmlint sistemoje „Linux“, naudokite šią komandą pagal savo „Linux“ platinimą.

sudo apt install rmlint         [On Debian, Ubuntu and Mint]
sudo yum install rmlint         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/rmlint  [On Gentoo Linux]
sudo apk add rmlint             [On Alpine Linux]
sudo pacman -S rmlint           [On Arch Linux]
sudo zypper install rmlint      [On OpenSUSE]    

4. dupeGuru – raskite pasikartojančius failus Linux sistemoje

dupeGuru yra atvirojo kodo kelių platformų įrankis, kurį galima naudoti norint rasti pasikartojančius failus Linux sistemoje. Įrankis gali nuskaityti failų pavadinimus arba turinį viename ar keliuose aplankuose. Tai taip pat leidžia rasti failo pavadinimą, panašų į ieškomus failus.

dupeGuru yra įvairių versijų, skirtų „Windows“, „Mac“ ir „Linux“ platformoms. Jo greito neaiškio atitikimo algoritmo funkcija padeda per minutę rasti pasikartojančius failus. Jį galima tinkinti, galite ištraukti tikslius norimus pasikartojančius failus ir ištrinti nepageidaujamus failus iš sistemos.

Įdiekite dupeGuru „Linux“.

Jei norite įdiegti dupeGuru sistemoje „Linux“, naudokite šią komandą pagal savo „Linux“ platinimą.

sudo apt install dupeguru         [On Debian, Ubuntu and Mint]
sudo yum install dupeguru         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/dupeguru  [On Gentoo Linux]
sudo apk add dupeguru             [On Alpine Linux]
sudo pacman -S dupeguru           [On Arch Linux]
sudo zypper install dupeguru      [On OpenSUSE]    

5. FSlint – pasikartojančių failų ieškiklis, skirtas Linux

FSlint yra nemokama programa, naudojama įvairių formų pūkelių paieškai ir valymui failų sistemoje. Ji taip pat praneša apie pasikartojančius failus, tuščius katalogus, laikinuosius failus, pasikartojančius/prieštaraujančius (dvejetainius) pavadinimus, blogas simbolines nuorodas ir daug daugiau. Jis turi ir komandinės eilutės, ir GUI režimus.

Tačiau svarbu pažymėti, kad iki mano žinių pabaigos 2022 m. rugsėjo mėn. FSlint paskutinį kartą buvo atnaujinta 2013 m. ir gali būti neaktyviai prižiūrima arba nesuderinama su naujesniais Linux platinimais.

Įdiekite „FSlint“ sistemoje „Linux“.

Norėdami įdiegti FSlint sistemoje „Linux“, naudokite šią komandą pagal savo Linux platinimą.

sudo apt install fslint         [On Debian, Ubuntu and Mint]
sudo yum install fslint         [On RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/fslint  [On Gentoo Linux]
sudo apk add fslint             [On Alpine Linux]
sudo pacman -S fslint           [On Arch Linux]
sudo zypper install fslint      [On OpenSUSE]    

Išvada

Tai labai naudingi įrankiai norint rasti pasikartojančius failus Linux sistemoje, tačiau tokius failus turėtumėte būti labai atsargūs.

Jei nesate tikri, ar jums reikia failo, ar ne, geriau būtų sukurti to failo atsarginę kopiją ir atsiminti jo katalogą prieš jį ištrinant. Jei turite klausimų ar pastabų, pateikite juos toliau esančiame komentarų skyriuje.