If-Koubou

Izgradite raspored preuzimanja s malim programskim vještinama

Izgradite raspored preuzimanja s malim programskim vještinama (Kako da)

Svi volimo preuzeti sadržaje s interneta, a tu su i hrpe velikih alata za upravljanje preuzimanjem koje možemo koristiti za zakazivanje naših preuzimanja. Možda bi bilo jednostavnije upotrebljavati upravitelja preuzimanja, ali nema štetu u istraživanju alata koji već dolaze s našim Ubuntu i čine ga u potpunosti iskoristiti.

U ovom članku ćemo vam pokazati ugrađeni softver u Ubuntu koji možemo koristiti za preuzimanje sadržaja s interneta wget, Na vrhu toga ćemo vam pokazati kako zakazati preuzimanje pomoću programa Cron.

Preuzimanje koristeći Wget

Wget je besplatni programski paket za preuzimanje datoteka pomoću HTTP, HTTPS i FTP, najčešće korištenih internetskih protokola. To je neinteraktivni alat za naredbeni redak, tako da se može lako nazvati iz skripti, cron radnih mjesta, terminala bez podrške za X-Windows, itd.

Otvorite terminal i istražite kako možemo koristiti wget za preuzimanje sadržaja s mreže. Osnovna sintaksa skidanja s wgetom je sljedeća:

wget [opcija] ... [URL] ...

Ova će naredba preuzeti priručnik wget u vaš lokalni pogon

wget http://www.gnu.org/software/wget/manual/wget.pdf

Linux Cron

Ubuntu dolazi s kron demom koji se koristi za zakazivanje zadataka koje treba izvršiti u određeno vrijeme. Crontab vam omogućuje da odredite radnje i vremena za izvršavanje. Ovo je način na koji biste obično zakazali zadatak pomoću alata naredbenog retka.

Otvorite terminalni prozor i unesite crontab -e.

Svaki od odjeljaka u crontabu odvaja se prostor, a završni dio ima jedan ili više mjesta u njemu. Cron ulaz sastoji se od minute (0-59), sata (0-23, 0 = ponoć), dana (1-31), mjeseca (1-12), radnog dana (0-6, 0 = nedjelja). Treći unos u gore navedenom crontab preuzimanju wget.pdf u 2 sata ujutro. Prvi unos (0) i drugi unos (2) znači 2:00. Treći od pete stavke (*) označava bilo koje doba dana, mjeseca ili tjedna. Posljednji unos je naredba wget za preuzimanje wget.pdf iz navedenog URL-a.

To je osnovno na Wgetu i kako funkcionira Cron. Uzmimo plijen u pravi život primjer o tome kako raspored preuzimanje.

Zakazivanje preuzimanja

Preuzet ćemo Firefox 3.6 u 2 ujutro. Budući da naš ISP daje samo ograničenu količinu podataka, moramo zaustaviti preuzimanje u 8 sati ujutro. Ovo je ono što izgleda postava.

Zanemari prva 2 unosa u gore navedenom crontabu. Treća i četvrta naredba su samo dvije naredbe koje vam trebaju. Treća naredba postavlja zadatak koji će preuzeti Firefox u 2 ujutro:

[kodirati]
0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-GB
[/kodirati]

Opcije -c označavaju da wget treba nastaviti postojeći preuzimanje ako to nije dovršeno.

Četvrti naredba zaustavlja wget u 8 sati ujutro. 'Killall' je unix naredba koja ubije procesa po imenu.

[kodirati]
0 8 * * * killall wget
[/kodirati]

Ubojica Wget kaže Ubuntu da zaustavi wget da preuzme datoteku u 8 sati ujutro.

Ostale korisne naredbe wget

1. Navođenje direktorija za preuzimanje datoteke

[kodirati]
wget -output-document = / home / zainul / Preuzimanja / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
[/kodirati]

opcija - izlazni dokument omogućuje vam da navedete imenik i naziv datoteke koju preuzimate

2. Preuzimanje web stranice

wget također može preuzeti web stranicu.

[kodirati]
wget -m http://www.google.com/profiles/zainul.franciscus
[/kodirati]

Gornja naredba će preuzeti čitavu web stranicu google profila. Opcija "-m" navodi wget da preuzme sliku "zrcala" navedenog URL-a.

Druga važna opcija je da kažem wget koliko veza treba slijediti kada preuzme web stranicu.

[kodirati]
wget -r -l1 http://www.google.com/profiles/zainul.franciscus
[/kodirati]

Gornja wget naredba koristi dvije opcije. Prva opcija "-r" kaže wgetu da preuredi rekurzivno navedenu web stranicu. Druga opcija "-l1" govori wget da dobije samo prvu razinu veza s navedene web stranice. Možemo postaviti do tri razine "-1 2" i "-13".

3. Zanemarivanje ulaska robota

Webmaster održava tekstnu datoteku Robot.txt. "Robot.txt" održava popis URL-a koji alat za indeksiranje web stranice, kao što je wget, ne bi trebao puzati. Možemo reći Wgetu da ignorira 'Robot.txt' s opcijom '-erobots = off'. Sljedeća naredba kaže wgetu da preuzme prvu stranicu svog google profila i zanemari 'Robot.txt.

[kodirati]
wget -erobots = isključite http://www.google.com/profiles/zainul.franciscus
[/kodirati]

Druga korisna mogućnost je -U. Ova opcija će maskirati wget kao preglednik. Imajte na umu da maskiranje aplikacije kao druge aplikacije može kršiti termin i servis davatelja internetskih usluga.

[kodirati]
wget -erobots = off -U Mozilla http://www.google.com/profiles/zainul.franciscus
[/kodirati]

Zaključak

Wget je vrlo stara škola, ali ipak hakerni GNU programski paket koji možemo koristiti za preuzimanje datoteka. Wget je interaktivni alat naredbenog retka, što znači da možemo dopustiti da se pokreće na našem računalu u pozadini bez potrebe za pokretanjem bilo kakve aplikacije. Provjerite stranicu wget man

[kodirati]
$ wget
[/kodirati]

razumjeti druge opcije koje možemo koristiti s wgetom.

linkovi

Wget Manual
Kako kombinirati dvije preuzete datoteke kada wget ne uspije na pola puta
Linux QuickTip: Preuzimanje i uklanjanje niza u jednom koraku