phantomjs – парсинг web с поддержкой js

Зачем
В отличии от mechanize, который очень удобен и функционален, phantomjs, судя прямо из названия, поддерживает исполнение javascript без установки браузера.
Установка
Устанавливать проще всего через apt-get/yum. Можно так же скачать пакет с сайта, плюсом будет самая свежая версия пакета.

Читать дальше

w3m

w3m bash.im – текстовый браузер. В теории можно серфить, на практике использовал только как-то с опцией –dump чтобы удалить все теги без каких-то sub/replace и прочих инструментов.

w3m -dump yandex.ru


Читать дальше

PHP wget/curl

Выгрузка содержимого страницы в php. Юзал fopen насколько помню, чтобы отдать URL с переменной нужно заменить скобки ” на “”.
$url = fopen('http://example.com/script.php?login=admin&password=qwerty', "rb");
$text = stream_get_contents($url);
fclose($url);
print $text;

file_get_contents('https://chart.googleapis.com/chart?cht=p3&chs=250x100&chd=t:60,40&chl=Hello|World&chof=json')


Читать дальше