Парсинг se без бана
Стала тут недавно задачка отпарсивать базы быстрее чем это я делал. Я юзал десктопный парсер от GlobalSquid , ставил паузу между запросами в 18-20 секунд, и за несколько недель получал базу. В принципе на потоке оно не сильно раздражает, но в последнее время из-за массированного спама базы стали убиваться довольно быстро и, соответсвенно, понадобились свежие.
В общем обратил внимание на разные крупные сайты с встроенной поисковой машиной от гугла.
Вот пример . Поиск таких ресурсов был затруднён, т.к. я не смог выявить общего признака наличия гуглового поиска на таких сайтах. Но удалось наковырять штук десять методом тыка по крупным сайтам и порталам + статистика переходов на один из моих сайтов из таких се со счётчика liveinternet.ru пригодилась.
После этого я отобрал те se, у которых выдача наиболее приближена к гуглу и количество в выдаче большое. Заказал многопоточный парсер одного такого движка. Работает без бана и очень шустро.
Однако база всё-таки вышла не очень большая. Не такая как при парсинге из гугла.
В общем по итогу прикупил очень хороших приватных прокси, которые не дохнут днями и даже неделями + очень быстрые и зарядил десктопный парсер без паузы. Суммарно парсинг гугла и такой вот байды даёт весьма неплохую базу.
Полезная штучка от гугла и вообще…

Прошлый мой пост в блоге был проверочным для системы Блогун (там такое требование при регистрации накатать пост)
Предложения были по писят центов
Вердикт: подходит для школьников
По теме поста - у гугла есть отличная подстановка к запросу, чтобы увидеть соответствующую гео выдачу. Сравнивал неоднократно с выдачей на intop20 и через американский и канадский впн - совпадает. Причём работает вплоть до того, что адсенс показывает ориентированный на конкретные страны.
Собственно всё просто: к запросу добавляем &gl=us, &gl=de, &gl=ca … и т.д.
Зарабатываем на своём блоге
![]()
Ради интереса зарегистрировался в системе Блогун , чтобы проверить работает это в моём случае или авторский блог - это всё-таки прежде всего блог ![]()
Если кратко, то блоггер зарабатывает на заказухе - заказные рекламные посты. На сайте Блогуна можно либо самому заказать рекламный пост на интересующем блоге, либо вот как я стать продажным блоггером.
Повторюсь, что всё это в порядке эксперимента. По результатам напишу позже
Всех читателей моего блога - С Новым годом
!
Alexa TOP million sites
Алекса выложила свой топ 1000000 сайтов.
Говорят ранее просила деньги за такую статистику. Как применить его в поиске хостов для доров или других целях - дело ваше ;-) Если подойти с умом, то инфа однозначно полезная.
Фишка для автопостинга под wordpress.
Вчера придумал такую фичу для шопов построенных на движке вёрдпресса где идёт автопостинг. Например, подойдёт для киновипа, мп3фиесты, мп3скайлайна и т.п., где можно постепенно, по крону, накачивать шоп постами.
Так вот, при постинге хорошо если идёт пингование блогосервисов. Хорошо это для быстрого индекса. Трастовые домены ещё и получают топ при этом. Но для трастовости нам нужно некотрое время и, конечно, много качественных тематических бэклинков.
В ручном варианте постинга есть поле для трэкбэк пинга. Туда очень полезно вставлять урлы для пинга нужных постов других блогов. В варианте автопостинга я ещё ни у кого не видел такого функционала. Идея простая: собираем базу трэкбэк урлов (желательно тематических, конечно), вставляем её в текстовый файлик и при посте скрипт берёт оттуда по одному урлу и пингает. Один пост - один пинг. Таким образом получаем бэки на внутренние страницы.
Озадачил этим вопросом техсаппорт мп3скайлайна - обещают реализовать.
Собираем НЧ кеи
Совершенно случайно забрёл на давно знакомый поиск по разным продуктам у Гугла, который назывался раньше Froogle (а может и сейчас) и в стрельнула мысль что на главной странице просто клад реальных низко и среднечастотных кеев.
C каждым рефрешем страницы мы получаем столько кеев, сколько нам нужно. Можно оформить скриптик выдирающий это добро. Ну а дальше - в путь
Каждый применяет собранную базу по своему. Можно отсортировать по заднным кеям, например. Можно по конкуренции.
С долларами напряжёнка.
В связи с мировым кризисом и мудрым руководством нашей страны никто не хочет просто так расставаться с баксами. Известные банкоматы банка “Надра” не дают, наверное, не только доллар, но и гривну.
Приходится искать кто же даст зелень. За 2% выдают банкоматы ПУМБа , но и в них всё тяжелее найти искомые дензнаки. И вот, о чудо, у себя в глухомани найден банкомат в котором они есть! Правда выдают какие-то старые купюры, иногда надорванные. И по 50. Но выдают
А вообще ситуация грустная: сам процесс покупки безналичной валюты и перевода ее в нал - очень затратный. С учетом того, что НБУ ограничил размер комиссии 1,5% от стоимости, по которой он продает ее банкам, эффективность операции и ее доходность сильно снизилась. Банки видят, что она бессмысленная и даже убыточная. Ещё и вводят комиссию на продажу наличной валюты по-моему 1.5%. Ну и до кучи ещё с нового года закроют обменки.
Мы живём в самой лучшей стране в мире. И все остальные страны нам завидуют :) Ха ха ха.
МП3фиеста рассказала как она продолжит работу
Товарищи из фиесты выкатили новость о том, в каком виде они дальше продолжат работу. Если кратко - то ребиллов, того вкусного, что давала эта тема, не будет. Всё плохо, и ребиллами овнеры будут компенсировать себе на плюшки с чаем. Топик, по выше приведенной ссылке, вышел очень ярким. Я тоже немного отметился, но дальше буду в роли читателя.
Жалко, что пропадает набранная за чуть больше года база кастомеров, жалко, что будет новый домен и теперь юзер должен в 2-3 шага добираться до оплаты с моих доров. ТОП10 мастеров говорит о том, что либо люди сняли трафик с фиесты, либо фиеста не работает в нормальном режиме.
В общем крест на мп3 теме не ставим, но продолжаем работать с mp3skyline - там и ребиллы есть и выхлоп не хуже вроде как получается.
Инвайты на скайлайн можете взять тут
FireBug для FireFox. Редактируем всё :)

Вчера решил поправить шрифт на киновиповском блогошопе - флагмане моей мини сетки
Давно мозолил глаз крупный и некрасивый шрифт. И с наскоку не получилось найти где его отредактировать. Взявшись вчера за это с удвоенной энергией я потратил много времени так и не достигнув результата. Решил стукнуть в аську знакомому дизайнеру (студия Creaccio) с этим вопросом. И он подсказал просто волшебный плагин к Firefox - FireBug
Это просто сказка. Выделяешь на сайт нужный блок мышкой, кликаешь правой кнопкой выбирая Inspect Element, и перед тобой кусочек html кода, кусочек css с указанием на какой строке настройки выделенного элемента. Причём можно прямо там править css, и видеть как меняется страница. Офигительная по полезности шутковина.
Вот откуда такой PR у людей ?

Случайно наткнулся на какой-то неказистый с виду блог http://blog.truste.org/ , а у него PR8.
Вот бы ссылочек с него поиметь :) Даже интересно что может дать одна ссылка с него на свой ресурс.

