JQuery-like DOM селекторы для PHP
пост написан и отправлен в печать 2009-03-12 примерно в 09:09
Я думаю, что многие знакомы с JavaScript селекторами библиотеки JQuery да и многих других, которые идеологически были позаимствованы у CSS и являются очень удобным инструментом для работы с DOM-ом документа. И в то же время многие, я уверен, сталкивались с ситуацией, когда нужно с какого-то сайта спиздить какую-то информацию, которая не синдицируется в rss-ах или atom-ах, поэтому приходится разбирать регулярками html код документа. С мучениями покончено, как говорит нам какая-то реклама моющего средства, превращающего плиту, на которую вылили 10 кг. говна в блестящую перламутровую поверхность. Оказывается, есть такая библиотека, как PHP Simple HTML DOM, поддерживающая все базовые селекторы, инвалидный код, на котором обычный simplexml уже обламывается, работающая с модным паттерном method-chaining, но только под php5+, что в наше столетие научного прогресса и технических инноваций уже не актуально - только инфантильный, однорукий и немного мертвый реселлер какого-то дешевого vds-а не проапдейтился до пятерочки.Ради теста библиотеки решил взять неизвестный в кругах слепых людей и достаточно популярный среди кармадрочеров и троллей мелкого помола сайт habrahabr.ru. Была поставлена задача написать код, который извлекает список вакансий и рейтинг компаний с главной страницы в массив, который потом уже можно использовать где-то. В итоге на все про все ушло минут 15, это учитывая время прочтения неплохой документации с примерами и заваривания чая Липтон Лейбл Ти. Посмотреть исходный код можно в копипастере, ну и пример работы тоже имеется.PS: увы, писать теперь буду пореже: наконец-то остепенился, ушел в политику и макроэкономические исследования, собираю монетки 18-го века и занимаюсь кучой других никому ненужных и неинтересных дел, который впрочем отнимают очень много свободного времени.