开源网站访问总计体系Piwik的主干选用

By admin in 亚洲必赢app在哪下载 on 2019年3月22日

piwik简介

近日试用了开源的网站访问总括种类——piwik,觉得作用尤其强劲,一点不输于商业产品百度总结与google
analysis,替代他们完全没有毛病。

有关piwik的简介能够去piwik的官网(http://piwik.org)查看,有详细的介绍和视频演示。之前codeweblog.com也有简单的介绍(http://www.codeweblog.com/p/piwik)。

以下是收集到的分析数据效果图:

亚洲必赢app在哪下载 1

亚洲必赢app在哪下载 2

piwik安装

第③需求消除正视项(http://piwik.org/docs/requirements/),ubuntu/debian使用下列命令安装所有依赖项(我用的是apache,别的webserver请替换成相应的软件包)

apt-get install apache2 mysql-server php5 php5-mysql php5-gd

如需定位访客的地理地方,参考官方文书档案:
http://piwik.org/docs/geo-locate/,
大概采用JS追踪的措施,通过JS代码获取访客的IP归属地。

设置进度参考官方文档(http://piwik.org/docs/installation),比较简单,就不详细介绍了。

配备好apache之后,通过浏览器访问,一步步配备达成之后,看到如下界面之后,就能够使用了:

亚洲必赢app在哪下载 3

亚洲必赢app在哪下载 4

亚洲必赢app在哪下载 5

piwik使用

刚装好的Piwik是环堵萧然的,此时大家需求那些系统帮大家总括数据。

当下Piwik协助二种征集用户访问记录的法子: JS追踪访问日志追踪

JS追踪可定制型高,能够博获得用户的分辨率,浏览器插件等等,还能捕获自定义变量。做客日志追踪(如apache的accesslog)能够追踪到用户的荒谬请求(如40X错误,有助于捕获到黑心用户和爬虫,蜘蛛等等),如今那二种追踪得到的数额还不帮助合并

那两种追踪格局的详尽优缺点能够参照官方的那篇文书档案:
http://piwik.org/faq/log-analytics-tool/faq\_16305/

JS追踪

管理设置-网站-右边即可看到"显示跟踪代码",如下图所示:

亚洲必赢app在哪下载 6

将此代码复制到web项指标footer中即可(即具有页面都停放那段同样的js代码,用于捕获用户的音信,如分辨率,浏览器UA,IP等),还足以遵从官方文书档案,捕获自定义变量。

参照官方文书档案的帮助,那里不再赘述:
http://piwik.org/docs/javascript-tracking/

log追踪

log追踪无需修改web项目,不过必须要有记名服务器并读取accesslog的权能。

log追踪的详实用法参考官方文档: http://piwik.org/faq/log-analytics-tool/,
https://piwik.org/log-analytics/

log追踪的进度是分析webserver的accesslog,然后经过piwik的API上传,最后在piwik页面上海展览中心示。

以此进度不用自身去达成了,piwik的缩减包中早已包涵2个python脚本能够帮助大家做到那么些工作了,该脚本存款和储蓄于piwik目录下的misc/log-analytics/import_logs.py

将那么些剧本远程拷贝到目的服务器上,遵照剧本的参数格式执行即可,笔者的命令行:

    ./import_logs.py --url=http://192.168.1.106/piwik/ --idsite=1 --recorders=2 --token-auth=319fb461d3225905039551e861edde60 --enable-static --enable-bots --enable-http-errors --enable-http-redirects /var/log/apache2/access.log

使用--help参数即可看出那几个本子的命令行,唯有多个--url参数是必须的,指明piwik的访问路径。详细辅助参见官方文书档案(https://piwik.org/docs/log-analytics-tool-how-to/),这里对我使用的参数做一下简介:

--idsite注脚抓取到的音信上传到哪个序号对应的网站(那里的参数为1,代表分析的数据会总括到first_web那一个网站中)

--token-auth亚洲必赢app在哪下载,其一参数是组织者的访问token,在系统页面最顶上的API点开即可知到,如下图所示。这几个参数能够利用--login=LOGIN --password=PASSWORD那多个参数替代,必须是组织者的账户和密码。

亚洲必赢app在哪下载 7

--recorders选拔多线程解析,暗中同意为1,官方建议那些参数和着力数相同。

--enable-static --enable-bots --enable-http-errors那多个参数基本上把apache的accesslog能抓取到的整整新闻都抓全了,抓取静态财富(jpg,png,js,css等非html的拜会),抓取bots(不精通这些是何等,估摸是或不是是机器人?),抓取html错误码(如40X请求等等)

/var/log/apache2/access.logapache的accesslog存放路径,常见的webserver如nginx,lighthttpd等,脚本自带有解析引擎,无需其他参数,假诺不行见webserver的话,加上--log-format-regex以此参数来自定义日志格式抓取。

当脚本实施达成时,即可在piwik中来看网站的造访记录了,使用也很便宜。短时间接选举取能够写入crontab即可。

注意:

  • log解析的方式追踪相比慢,不适合实时追踪用户访问记录,提议每过几钟头实施三遍crontab,来定时解析log。
  • 一经打开了--enable-static --enable-bots --enable-http-errors那八个参数,解析进程将会很缓慢(小编那边大致十几条每秒),不要让crontab太频仍,会平昔让mysql数据库超出连接而挂掉,小编是每4小时实施一回crontab。

其余一些题材

1,log追踪和js追踪的艺术互有优势,都足以抓到一些对方所不能够取得的音信,但是如今这两种方式追踪到的数目还不匡助合并,因而,须要同时使用那三种办法追踪时,提议分开七个分歧的网站追踪分裂的多少,如first_web用于JS追踪,first_web(log)用于log追踪。参见官方FAQ:
http://piwik.org/faq/log-analytics-tool/faq\_16307/

2,当访问量较高时,请关闭Piwik触发处理,已抓实页面响应,刷新报表数量由后台crontab执行,参考如下图所示,crontab的安装见左边的唤起中的官方文书档案:

亚洲必赢app在哪下载 8

3,自动邮件的小运稍微题目,piwik内部时间使用的是UTC时刻,也正是中华时区(CST,东八区)比UTC时区的日子快九个时辰。如果利用暗中认可的邮件发送时间0点发送,将会收下前几天的造访记录报表(中华夏族民共和国流年0点对应UTC时间明天的16点,那么此时发前几天的表格就会接收前天的告诉)。

那几个标题已经给官方提过issue,可是官方还并未回答本身:
http://forum.piwik.org/read.php?2,111809

目前的方案是把时间改到8点之后,就能够吸收不荒谬的邮件报表。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图
Copyright @ 2010-2019 亚洲必赢app官方下载 版权所有