Посмотрите, что Xidel может сделать для вас

Посмотрите, что Xidel может сделать для вас

Наверное, никто из вас не слышал о нем? Кто такой таинственный Ксидель, может быть, что? И что связано с SEO? Вероятно, вы уже догадались, о чем будет вести запись. Я представлю в нем небольшой, аккуратный и чрезвычайно функциональный инструмент под названием Xidel. Что вы можете использовать для этого программного обеспечения? Иными словами, до даты добычи, другими словами, получить (отменить) все виды информации, которые включают адреса каталогов и кренделей, прокси, результаты поиска, фотографии, фотографии.

Бесплатный скребок XQuery, XPath, CSS3

Xidel сдерживает интерфейс, хм … или скорее его недостаток. Вероятно, слишком многим людям это не понравится, но это хорошо, потому что меньше людей знают об этом (и используют его), тем лучше. Инструмент управляется из окна консоли. Как говорится что-то для чего-то. Мы получаем мегафункцию за счет внешнего вида, но на самом деле нас интересует только второй вариант.

В настоящее время Xidel позволяет создавать выражения с использованием языка пути XPath 2.0, языка запросов XML — XQuery 1.0, селекторов CSS3, а также шаблонов или упрощенных версий страниц, которые являются конкретным шаблоном.

Ниже приведены некоторые примеры для XPath. Дополнительные примеры и подробную информацию об этом инструменте можно найти в файле справки (readme.txt).

Извлечение адресов каталогов …

xidel.exe http://www.katalogiseo.info --extract "//tr/td/a[@class='broken']"

Извлечение нескольких данных одновременно (в этом примере — адрес каталога и тип скрипта) …

xidel http://www.katalogiseo.info -e "//tr/td/a[@class='broken']" -e "//tr/td[3]/a"

После выполнения инструкций программа по умолчанию будет отображать данные в окне консоли. Конечно, такая вещь не делает нас полностью, самым простым способом записи данных является перенаправление потока на конкретный файл. Поэтому мы изменим команду …

xidel http://www.katalogiseo.info -e "//tr/td/a[@class='broken']" -e "//tr/td[3]/a" >d:\dane.txt

Наличие файла результатов может быть дополнительно обработано в текстовом редакторе или в электронной таблице.

Наверняка вы скажете, что интересного в этом инструменте? Почерк — это не удовольствие. Ну, правильно! Но ничто не мешает (за исключением желаний и навыков, конечно) писать сценарий, который автоматически извлекает данные с веб-сайта. Если мы добавим к тому, что Xidel поддерживает различные методы скремблирования (языки), вы можете использовать его достаточно хорошо, и он также полностью свободен, так как soft становится доступным как Open Source.

Xidel — очень интересный проект, развитие которого заслуживает внимания!

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *