Жужжальня для веб-мастера Жужжальня для веб-мастера
Имя: E-mail: Url:
Проверочка:

CyberLink   15.12.2006   09:53

Долго думал, как тебе ответить, потому что мой взгляд на этот вопрос все же обусловлен тем, что я одновременно являюсь и хостером, и разработчиком (и дизайнером) в одном лице... постараюсь все же озвучить относительно нейтральное мнение.

На сегодняшний день в мире сложилось два подхода к накоплению и хранению данных.

Один из подходов заключается в том, что место на диске и трафик настолько дешевы, что можно считать их практически бесплатными. Такой подход исповедует компания Google. Когда кончается место - просто покупаются дополнительные жесткие диски и т.п.

С другой стороны так могут думать компании, которые не стеснены в ресурсах оборудования, финансовых и т.п. Компании не столь крупные, а тем более частные лица, проекты которых приносят не столь астрономические суммы, а зачастую и вовсе ничего не приносят, вынуждены все же считаться с тем, что работать придется в условиях ограниченных ресурсов.

Здесь важно найти ту золотую середину, тот оптимум соотношения необходимости и возможностей, который бы всех устраивал. Большая часть систем статистики не хранит необработанную информацию дольше, чем за определеный период (обычно 3-6 месяцев).

Это обусловлено тем, что уже обработанных данных в виде готовых отчетов вполне достаточно для работы со статистикой старшей чем несколько месяцев и необходимость влазить в подробности возникает не часто. Поэтому старые данные просто уничтожаются, а в базах остаются только готовые отчеты. На таком принципе основаны практически все системы статистики в том числе и прикладные программы типа MRTG, RRD (используются провайдерами и хостерами для отображения и хранения статистики трафика и других параметров) и Webalizer (лог-анализатор). Fed, кстати, вот у тебя за сколько времени хранятся данные?

Поэтому здесь нужно смотреть самому, что для тебя важнее. Хранить больше данных оплачивая аренду большего места на диске у хостера или просто докупая дополнительные винты в свои серверы или все же оптимизировать объемы хранимой информации за счет обобщения. По похожему принципу строятся и другие системы (например хранение версий в резеврном копировании) и в каждой определяется, сколько хранить данные и когда их удалять.

Николай   14.12.2006   23:45

Как можно Flash Mx Заставить писать по русски

CREA   14.12.2006   22:37

CyberLink:

хорошее решение, но пока нет надобности это делать. Но тут вырисовывается другая проблемка - рост физического файла базы и журнала транзакций, которые можно уменьшить архивированием только если ты имеешь администраторские права на хостинг сервер или каждый раз просить об этом хостера :) Или есть другое решение?

CyberLink   14.12.2006   21:42

CREA, данные за прошлые периоды обобщать и складывать в архивные таблицы (и вообще не хранить за более, чем N-месяцев, а хранить только уже просчитанные отчеты - обобщенные данные).

CREA   14.12.2006   20:55

2 FED:
>> как синхронизируете

если я правильно понял, то ты имеешь в виду как синхронизируются эти данные с конкретным посетителем? Если да, то скрипт определения разрешения и глубини записывается в выходной файл только для самой первой затребуемой страницы при назначении ID сессии - после этого для данного ID больше никакой скрипт не генерируется.

>> я так понимаю, что это у вас модуль для апача?

модуль не для апача, а для IIS'а. Но почитав стравнения ASP.NET и PHP - уверен, что то-же самое делается и для Apacha

2 CyberLink:

>> Дык, аггрегировать нужно :)

Не совсем понял, что ты под этим подразумеваешь.

CyberLink   14.12.2006   20:12

Fed, эх... дела давно минувших дней :)

CyberLink   14.12.2006   20:10

Fed, GeoIP слишком громоздок и тяжел - даже если залить себе его базу локально. Тебе ведь не нужна разбивка по городам и провайдерам, которая по ходу еще и весьма неточная :) Для определения стран вполне достаточно брать списки делегированных сетей прямо с сайтов IANA и RIPE. Вот, например, как делают люди http://ip.ludost.net/

CREA:

Дык, аггрегировать нужно :)

Fed   14.12.2006   20:05

по поводу Киберлинка как дезигнера - когда-то он был вполне крут :)
1998, кажется, ЦЛ?
почему-то запомнился какой-то твой сайт про АОНы, симпатичный был.

>Fed, я так понимаю, что CREA хочет развить...

похоже.
неплохая идея.

Fed   14.12.2006   20:02

CREA,

ну это вроде как очевидно, что данные парсятся и ложатся (а не кладутся ;) ) в базу.
в различных архитектурных решениях подобных систем при большом трафике может быть (но не обязательно) промежуточная офф-лайновая часть с последующим разгребанием в параллельном процессе (сейчас так сделано в Акавите, если кому интересно).

я так понимаю, что это у вас модуль для апача?

>Правда именно на этом домене страна не определяется, т.к. закрыт порт доступа к Ripe.

ну есть же и всякие geo-ip для таких случаев...

>Но на сайт код счетчика надо поставить для того, чтобы определить только разрешение экрана и глубину цвета.

а как синхронизируете?

CREA   14.12.2006   19:40

2 FED:

Чтобы разобрать запрос и записать разобранные данные в БД для дальнейшей удобной выборки для отчетов. Например страна, провайдер, поисковая фраза, ссылающиеся страницы. Я так сделал тут:

http://cms.intelliweb.by/StatUsers/Default.aspx

Конечно, все это можно делать на лету при построении отчета только исходя из исходного запроса - но это будет дольше. Недостаток моего варианта - больший размер базы статистики.

Правда именно на этом домене страна не определяется, т.к. закрыт порт доступа к Ripe.

Но на сайт код счетчика надо поставить для того, чтобы определить только разрешение экрана и глубину цвета.

Но еще одно преимущество вышеописанного метода - не надо дожидаться загрузки кода счетчика, чтобы засчитать посещение страницы.

CyberLink   14.12.2006   18:30

CyBeer, что не стыдно показать в ротации на главной странице :) Нажимаешь рилоад - картинка меняется.

CyBeer   14.12.2006   17:01
http://orangeonweb.com

CyberLink, покаж что рисовал :)

CyberLink   14.12.2006   12:26

Fed, я так понимаю, что CREA хочет развить идею создания системы статистики, которая бы считала с точностью не хуже веб-счетчика и которая бы не требовала установки кода на сайт. Примерно то, о чем мы с тобой говорили около года назад в применение к Apache.

CyberLink   14.12.2006   12:22

Elvis, каждый продукт используется для своих целей. Картинки, как у меня на заглавной http://paully.com/ в ротации в Photoshop или Painter. Что-то из области дизайна в Photoshop. Вектор в Illustrator или Draw - что в данный момент под рукой. Подозреваю, что под Corel имелся ввиду не Painter, а все-таки Draw? :-)

А вообще приходится работать в том, что есть под рукой. На моем компьютере например в Photoshop слетела лицензия и мне просто лень его переинсталлировать. Пришлось дизайн раскладки плитки для рабочей зоны на кухне делать в ImageReady - http://paully.com/!/plitka.png :)

А если честно, то последние года три редко выдается случай, когда я занимаюсь дизайном или рисую - много другой работы.

Fed   14.12.2006   02:41

CREA,

а зачем вообще что-то перехватывать, когда в своём httpd запрос ложится сам прямо тебе в карман?

CREA   13.12.2006   23:55

2CyberLink:

httpModule - в ASP.NET не надо никакие логи анализировать - на лету прехват Request и все

Elvis   13.12.2006   21:56

CyberLink это вопрос

Стилист   13.12.2006   14:31

Я рад всех снова видеть, друзья!

OS, почему блог не обновляешь?

Fed   13.12.2006   13:48

CyberLink,

видимо, CREA открыл для себя лог-анализаторы Ж)

CyberLink   13.12.2006   13:20

Elvis, это намек или реальный вопрос? :)

klassno, разбор логов немного для других целей нужен.

CREA, что значит на уровне запросов?

Ос
Вебмастеру Ты дизайнер?

Расширенный поиск по архиву жужжальни

1  <<  2051  2052  2053  2054  2055  2056  2057  >>  2100

Ос
Вебмастеру Ты дизайнер?


Реклама