никто вас пинать не станет ни через неделю, ни через месяц, не надейтесь
Ну вот, все сам да сам... Никакой помощи
А если серьезно, то. Последние новости (как обычно, хорошая и плохая).
Поскольку плохая новость больше похожа на нытье двоечника, невыучившего уроки, уберу под оффтоп. Там по большей части всякие технические подробности, которые мало кому интересны.
(коротенько, минут на сорок, про трудности, с которыми приходится героически бороться)
Тот сайт, на который я давал ссылку, находится на сайте oracle.com. Там есть ознакомительная версия для изучения Oracle APEX (не будем вдаваться в подробности, что это), дается бесплатно, но с лимитом в 25 МБ. Я особо не интересовался размерами своей базы (да и лимитами бесплатного хостинга тоже, если честно), но было понятно, что если и уложусь, то совсем впритык. Некоторое время назад посмотрел - нет, не уложусь. Мне нужно будет мегабайт сто, наверно. Сейчас 8 занято, но это только список пользователей. Поэтому я наверно найду какой-нибудь VPS хостинг и подниму там все то же самое, но на это может уйти день - два.
Еще много вариантов пришлось перепробовать для организации перелива данных туда-сюда. Главная проблема была в том, что с задачами такого рода я не сталкивался, приходилось тыкаться наугад туда-сюда. Более-менее простой и рабочий вариант я нашел, но в этом варианте данные пока складируются у меня на компьютере. Как арендую хостинг, скину все туда.
Сегодня пофиксил последние баги, осталось совсем капельку дописать, так что завтра запущу (вот теперь уже 146%, что запущу) сбор основного массива. Я поставил ограничение примерно 5 секунд на топик и 2 секунды - для перехода в одном топике между страницами (то есть после загрузки одного топика идет пауза 5 секунд). Топиков порядка 100000, то есть собираться информация будет никак не меньше 6 суток, это если вообще не выключать. За это время, я надеюсь, разберусь с хостингом и прочими мелочами.
Все то время, пока данные будут лежать только у меня, могу по запросу делать изредка какие-нибудь интересные выборки (например, топ самых длинных топиков, топ пользователей, пишущих оффтопы, самые популярные смайлики, внешние ресурсы и пр.).
P. S. То есть теоретически, я даже могу до пятницы уложиться, как и обещал, только собрана будет примерно четверть данных.