/ / Побудуйте програму завантаження з невеликим вмінням програмування

Побудуйте програму завантаження з невеликим вмінням програмування

Ми всі любимо завантажувати речі з Інтернету,і є безліч чудових інструментів менеджера завантажень, які ми можемо використовувати для планування завантажень. Використовувати менеджер завантажень може бути просто простіше, але немає ніякої шкоди в дослідженні інструментів, які вже поставляються з нашим Ubuntu, і повною мірою ним користуватися.

У цій статті ми покажемо вам вбудоване програмне забезпечення в Ubuntu, яке ми можемо використовувати для завантаження матеріалів з Інтернету за допомогою wget. На додаток до цього ми покажемо, як планувати завантаження за допомогою Cron.

Завантажити за допомогою Wget

Wget - це безкоштовний програмний пакет для завантаженняфайли за допомогою HTTP, HTTPS та FTP, найбільш широко використовуваних Інтернет-протоколів. Це неінтерактивний інструмент командного рядка, тому його можна легко викликати зі скриптів, завдань із запиту на роботу з Cron, терміналів без підтримки X-Windows тощо.

Відкрийте свій термінал і давайте вивчимо, як ми можемо використовувати wget для завантаження речей з мережі. Основний синтаксис завантаження з wget є наступним:

wget [опція]… [URL]…

Ця команда завантажить посібник з wget на ваш локальний диск

wget http://www.gnu.org/software/wget/manual/wget.pdf

Linux Cron

Ubuntu поставляється з демоном-хроном, який використовується дляпланування завдань, які потрібно виконати на певний час. Crontab дозволяє вказувати дії та час їх виконання. Ось як ви зазвичай плануєте завдання за допомогою інструменту командного рядка.

Відкрийте вікно терміналу та введіть crontab -e.

Кожен з розділів у кронтабі відокремленийпробіл, остаточний розділ якого містить один або кілька пробілів. Запис крона складається з хвилини (0-59), години (0-23, 0 = опівночі), дня (1-31), місяця (1-12), буднього дня (0-6, 0 = неділя), команди. Третій запис у вищезазначеному crontab завантажує wget.pdf о 2 ранку. Перший запис (0) та другий запис (2) означає 2:00. Третій - п'ятий запис (*) означає будь-який час доби, місяця чи тижня. Останній запис - команда wget для завантаження wget.pdf з вказаної URL-адреси.

Це основна інформація про wget і те, як працює Cron. Давайте візьмемо багатство на прикладі реального життя щодо планування завантаження.

Планування завантаження

Ми завантажуємо Firefox 3.6 о 2 ранку. Оскільки наш Інтернет-провайдер надає лише обмежений обсяг даних, нам потрібно припинити завантаження о 8 ранку. Ось як виглядає налаштування.

Ігноруйте перші 2 записи у вищевказаному кронтабі. Третя та четверта команди - це лише 2 команди, які вам потрібні. Третя команда налаштує завдання, яке завантажить Firefox о 2 ранку:

[код]
0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-GB
[/ код]

Параметри -c позначають, що wget повинен відновити існуюче завантаження, якщо воно не було завершено.

Четверта команда зупинить wget о 8 ранку. "Killall" - це команда unix, яка вбиває процеси на ім'я.

[код]
0 8 * * * віджет killall
[/ код]

Віджет killall повідомляє Ubuntu припинити завантаження файлу о 8 ранку.

Інші корисні команди wget

1. Вказання каталогу для завантаження файлу

[код]
wget –output-document = / home / zainul / Завантаження / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
[/ код]

опція –output-document дозволяє вказати каталог та ім'я завантаженого файлу

2. Завантаження веб-сайту

wget також здатний завантажити веб-сайт.

[код]
wget -m http://www.google.com/profiles/zainul.franciscus
[/ код]

Наведена вище команда завантажить всю мою веб-сторінку профілю Google. Параметр "-m" повідомляє wget завантажити зображення "дзеркала" вказаної URL-адреси.

Ще один важливий варіант - сказати wget, скільки посилань має випливати при завантаженні веб-сайту.

[код]
wget -r -l1 http://www.google.com/profiles/zainul.franciscus
[/ код]

Наведена вище команда wget використовує два варіанти. Перший варіант '-r' повідомляє wget рекурсивно завантажувати вказаний веб-сайт. Другий варіант '-1' повідомляє wget отримати лише посилання першого рівня з вказаного веб-сайту. Ми можемо встановити до трьох рівнів '-l2' та '-l3'.

3. Ігнорування входу робота

Веб-майстер підтримує текстовий файл під назвою Robot.txt. "Robot.txt" підтримує список URL-адрес, за якими сканер веб-сторінки, наприклад wget, не повинен сканувати. Ми можемо сказати wget ігнорувати "Robot.txt" за допомогою параметра "-erobots = off". Наступна команда повідомляє wget завантажити першу сторінку мого профілю Google і проігнорувати 'Robot.txt.

[код]
wget -erobots = вимкнено http://www.google.com/profiles/zainul.franciscus
[/ код]

Ще один корисний варіант - U. Цей параметр маскує wget як браузер. Зверніть увагу, що маскування програми як іншої програми може порушити термін та послугу постачальника веб-послуг.

[код]
wget -erobots = off -U Mozilla http://www.google.com/profiles/zainul.franciscus
[/ код]

Висновок

Wget - це дуже стара школа, але все-таки хакерський GNUпрограмний пакет, який ми можемо використовувати для завантаження файлів. Wget - це інтерактивний інструмент командного рядка, що означає, що ми можемо дозволити йому працювати на нашому комп’ютері у фоновому режимі, не запускаючи жодної програми. Перевірте сторінку wget man

[код]
$ man wget
[/ код]

щоб зрозуміти інші варіанти, які ми можемо використовувати з wget.

Посилання

Посібник по Wget
Як поєднати два завантажені файли, коли wget не працює на півдорозі
Linux QuickTip: Завантаження та скасування відмітки за один крок