Автор: apple_rom , 31 октября 2008
Уважаемые обладатели толстых и быстрых!

Убедительная просьба при желании скачать сайт, учитывать, что данное желание нереально для Вас и, к большому сожалению, пока и нас одновремённо. Причина проста - он очень подрос и обурел, объём его из-за гигантской таксономии увеличился на порядок. Например, только один гугл приступил к индексации уже третьей сотни тысяч страниц:
Результаты 1 - 10 из приблизительно 210 000 с www.rom.by. (0,26 секунд)
А ещё на нашу серверную голову постоянно приползают полчища других пауков поисковиков. И если учесть кроме объёма сайта выросшую в последние время в несколько раз его популярность (с одной-двух до более чем пяти тысяч посетителей в день) - даже недавний переход на более современный сервер не спасает, когда вы ещё и начинаете "сосать не всебя".
Потому, ради общего блага - чтобы сайт был доступен для остальных 99.9% процентов пользователей - упомянутый 0.1% будет жёстко баниться (по айпишнику - вся подсеть провайдера качальщика). Понятно, что в результате будут страдать другие, сидящие на этом же провайдере пользователи.

Потому просьба, если Вам так уже нужно почитать в оффлайне какие-то материалы - обратитесь напрямую ко мне, я попытаюсь решить данный вопрос без скачивания сотен тысяч страниц сайта (которые всё равно не будут прочитаны даже на 1%).

Содержимое данного поля является приватным и не предназначено для показа.

BBCode

  • HTML-теги не обрабатываются и показываются как обычный текст
  • You may use the following BBCode tags:
    • [align]
    • [b]
    • [code]
    • [color]
    • [font]
    • [hr]
    • [i]
    • [img]
    • [list]
    • [quote]
    • [s]
    • [size]
    • [spoiler]
    • [sub]
    • [sup]
    • [table]
    • [u]
    • [url]
  • Адреса веб-страниц и email-адреса преобразовываются в ссылки автоматически.

icbook

17 лет 4 месяца назад

Может, проще за совсем условные деньги CD/DVD-ROM предлагать?

mikkey

17 лет 4 месяца назад

Зачем желающему скачать покупать диск, если он нахаляву качать может.
Предлагаю сделать архив и выложить на каком нибудь обменнике.

apple_rom

17 лет 4 месяца назад

Проблема при скачивании "тупыми" и "толстыми" (многопоточными с широкими каналом) качальщиками в следующем.
Сайт из-за наличия большой таксономии в абсолютном исчислении имеет около миллиона страниц (их реально ещё больше, но где-то столько доступно для гостей). На скорость работы пауков поисковиков (они тоже многопоточные) можно повлиять - через админку вебмастера или настройками файла robots.txt, в результате чего они напрягают сервер незначительно (терпимо даже когда все приходят толпами). Кроме того, при скачивании они отличаются интеллектом - не выкачивают постоянно одни и те же страницы, учитывают дату создания/изменения, используют свои алгоритмы обхода всего сайта и т.п. В то же время "обычные" программы не умеют всего этого и тупо выкачивают всё подряд по всем ссылкам на каждой странице.
Далее. Страницы на сайте генерятся динамически (именно поэтому их так много, в реальности уникальных страниц - несколько десятков тысяч). Для ускорения отдачи они кэшируются. Понятно, что "обычные" посетители в 95% процентов скачивают лишь "верхние", "популярные" страницы, которые как раз всегда закэшированы. В то же время качальщики, наоборот, сразу же "лезут вглубь", постоянно выкачивая некэшированные страницы. В результате два таких качальщика на сайте создают нагрузку много большую, нежели 200 обычных пользователей онлайн. И если одного качальщика наше текущее железо держит нормально, то когда начинают качать два сразу плюс "обычные" пользователи подтягиваются - сайт начинает тормозить. Когда приходит третий (качальщик) - сайт становится недоступным (лишь для "несчастных" обладателей узких каналов - качальщики же продолжают качать).
Потому пока не удалось настроить сервер на автоматическую раздачу банов неуёмным качальщикам - буду раздавать их вручную по результатам своей статистики. Первым кандидатом на постоянный бан является целая подсетка 94.50.0.0 - 94.51.255.255 (Екатеринбург, Уралсвязьинформ), так как с различных айпишников оной каждый день скачиваются десятки тысяч страниц. (Я не продвинут в познаниях структуры этой части интернета, потому буду признателен за информацию по данной подсети и почему там так много-часто-лихо качают :) ).

apple_rom

17 лет 4 месяца назад

Забанены подсетки:
94.50.x.x
90.150.x.x
Обе "Екатеринбург, Уралсвязьинформ".
Кто "попал под стрелу" и имеет собственный статический айпи - обращайтесь, добавлю исключение (хотя как вы увидите этот текст - вопрос :) ).

savely

17 лет 4 месяца назад

Так, сразу предупреждаю, заранее - если соберешься банить диапазон 212.041.032.000 - 212.041.063.255 - меня сразу предупредить!!!

Llama

17 лет 4 месяца назад

Последние два дня действует следующее ограничение для www.ROM.by :

1) Не более 256kb/sec на клиента
2) Не более 5 запросов в секунду
3) Не более 3 одновременных соединений

Полагаю, что "640kb хватит всем", если не хватит - сообщайте о конкретных случаях. Я был бы рад и дальше обходится без любых ограничений, однако у нас сейчас нет возможности ни оптимизировать используемое ПО сайта, ни увеличить производительность сервера.

savely

17 лет 4 месяца назад

Заметил. Ну, учел. Вообще - я с утра лезу в тракер и сразу открываю все новое (быстро, в Опере, Ctrl-Shift-клик). Но - не вопрос - буду медленнее. :-)))

Rom

17 лет 4 месяца назад

[off]
быстро, в Опере, Ctrl-Shift-клик

Савелий, средней кнопкой мыши быстрее получается :)[/off]

savely

17 лет 4 месяца назад

[off]
Савелий, средней кнопкой мыши быстрее получается

Неа, одинаково. При моем способе просто 2 руки работают. :-)
[/off]

Llama

17 лет 3 месяца назад

Текущие ограничения на скачивание сняты в связи с их неэффективностью.
Продолжаем банить.
Желающие скачать сайт могут пожертвовать что-нибудь с 4-8 ядрами в форм-факторе 1U.