Страница 1 из 1
Доделал парсинг! ))
Добавлено: 02 сен 2004, 14:58
v0iD0zZ3r
Ходил в места раздачи ссылок. Задолбало грузить рекламу на флеше и прочее... Решит прикрутить к своему сайту парсинг данных хлеьных мест.
Собственно вот его результат:
Колбасит пока 2 сайта (работы по расширению ассортимента ведутся).
Запускается по крону, раз в день, с утра.
Добавлено: 02 сен 2004, 19:29
LatexLiker
С твоего сайта Трояны во все щели через галереи лезут!!!
Добавлено: 03 сен 2004, 07:22
v0iD0zZ3r
[quote="LatexLiker"]С твоего сайта Трояны во все щели через галереи лезут!!![/quote]
Это не с моего. это по тем ссылкам, которые публикуются на 123latex4free и latex-post
у меня 4й кав. XP. IE6 (в котором секурность на максимуме). У меня ничего не грузит))), а то товарищь касперский бы вякать начал.
есть мысль по парсингу каждой ссылки, но бля это такой гимор. хотя возможно и буду делать, тогда будет только чистый хтмл+картинки с удаленных серваков.
Если есть идеи какие серваки можно попарсить, пишите, буду прововать их обработку писать.
Добавлено: 03 сен 2004, 10:49
LatexLiker
Понятно что из вражеских галлерей)
У меня W2K+IE60+DrWeb, который все это и присек на стадии заражения) попутно напрочь лишив части функциональности IE60) - пришлось переустановить IE)))
Добавлено: 03 сен 2004, 10:59
v0iD0zZ3r
[quote="LatexLiker"]Понятно что из вражеских галлерей)
У меня W2K+IE60+DrWeb, который все это и присек на стадии заражения) попутно напрочь лишив части функциональности IE60) - пришлось переустановить IE)))[/quote]
Ну не знаю... Что бы антивирус корячил систему....
А может быть ты под правами администратора работаешь?
Добавлено: 04 сен 2004, 21:25
Radja
А, интересно, под какими еще нужно можно работать на собственном компе, кроме как администратора??? А насчет того что б антивирь систему рушил я скажу такую вещь, что ие сам по себе очень нестабильный браузер. И он запросто могу рухнуть от того что антивирь ему запретил что-то делать.
Добавлено: 04 сен 2004, 22:28
Андрей
Люди не пользуйтесь этим убожеством IE

Лучше альтернативой, например Opera

Gal
Добавлено: 05 сен 2004, 03:20
anton
У мня тоже какая то хрень с компом приключилась. Нортоном прошел 6 вирусов оказалось.... Да и латекса там только в паре галлерей однако..

Re: Gal
Добавлено: 05 сен 2004, 08:20
latexf
Не ходите, дети, в Африку гулять!

Добавлено: 05 сен 2004, 08:27
v0iD0zZ3r
Например я работаю под правами power user. С измененными политиками для инсталляции новых дров.
Программы новые сталю редко, но в принципе не проблема подлогинится как админу, или runas.
пока что минусов не вижу)). вирус или троян как может запустится то? только при загрузке системы HKLM\software\microsoft\windows\Current Version\Run, а писать туда может только пользователь с правами администратора. то есть никак))).
опера это хорошо.... но как то не нравится ((
на тот же бат перешел с легкостью с ОЕ. а вот с браузером никак (((
либо lynx либо IE.
Дайте ссылок на другие хлебные места, желательно без вирусов)) буду признателен. Только желательно, что бы ссылки были на одной странице.
Добавлено: 05 сен 2004, 08:29
v0iD0zZ3r
"А, интересно, под какими еще нужно можно работать на собственном компе, кроме как администратора???"
power user по моему есть только в XP Prof. в Хоум Эдишн только админ и юзер. но в таком случае я бы под юзером работал. ))
Добавлено: 05 сен 2004, 21:29
Radja
Хватит умничать. Лучше пошивели мозгами как твою галерею пропустить через бесплатный сервис проверки на вирусы на сайте др. веба, например. Взломать можно в течении полу часа. Или только картинки выдирай. Что, кстати, тоже не очень сложно. Даю подсказку: анализируй по размерам картинки.
Re: Доделал парсинг! ))
Добавлено: 06 сен 2004, 06:41
latexf
Объясните мне негрмоШному хтой нибудь, что есть за штукенция такая - парсинг... Очень пирсинг напроминает однако....

Добавлено: 06 сен 2004, 07:39
v0iD0zZ3r
идея хорошая.
Re: Доделал парсинг! ))
Добавлено: 06 сен 2004, 07:41
v0iD0zZ3r
[quote="latexf"]Объясните мне негрмоШному хтой нибудь, что есть за штукенция такая - парсинг... Очень пирсинг напроминает однако.... :D[/quote]
парсинг:
1) получение исходного кода страницы.
2) обработка по определенным правилам (обрезка всего лишнего нах)
3) выдача результата в удобном виде ))