访问统计
访问统计
PV
PV 即 Page View,网站浏览量,指页面浏览的次数,用以衡量网站用户访问的网页数量。
用户每次打开一个页面便记录 1 次 PV,多次打开同一页面则浏览量累计。一般来说,PV 与来访者的数量成正比,但是 PV 并不直接决定页面的真实来访者数量,如同一个来访者通过不断的刷新页面,也可以制造出非常高的 PV。
具体的说,PV 值就是所有访问者在 24 小时(0 点到 24 点)内看了某个网站多少个页面或某个网页多少次。PV 是指页面刷新的次数,每一次页面刷新,就算做一次 PV 流量。
度量方法就是从浏览器发出一个对网络服务器的请求(Request),网络服务器接到这个请求后,会将该请求对应的一个网页(Page)发送给浏览器,从而产生了一个 PV。那么在这里只要是这个请求发送给了浏览器,无论这个页面是否完全打开(下载完成),那么都是应当计为 1 个 PV。
UV
UV 即 Unique Visitor,独立访客数,指一天内访问某站点的人数,以 cookie 或者 Token 为依据。
1 天内同一访客的多次访问只记录为一个访客。通过 IP 和 cookie 是判断 UV 值的两种方式。
用 Cookie 分析 UV 值
当客户端第一次访问某个网站服务器的时候,网站服务器会给这个客户端的电脑发出一个 Cookie,通常放在这个客户端电脑的 C 盘当中。在这个 Cookie 中会分配一个独一无二的编号,这其中会记录一些访问服务器的信息,如访问时间,访问了哪些页面等等。当你下次再访问这个服务器的时候,服务器就可以直接从你的电脑中找到上一次放进去的 Cookie 文件,并且对其进行一些更新,但那个独一无二的编号是不会变的。
VV
VV 即 Visit View,访客访问的次数,用以记录所有访客一天内访问网站的次数。
当访客完成所有的浏览并最终关掉该网站的所有页面时,便完成了一次访问,同一访客一天内可能有多次访问行为,访问次数累计。
IP
IP 即独立 IP 数,指一天内使用不同 IP 地址的用户访问网站的次数,同一 IP 无论访问了几个页面,独立的 IP 数均为 1。
这里需要注意的是:如果两台机器访问服务器而使用的是同一个 IP,那么只能算是一个 IP 的访问。
IP 和 UV 之间的数据不会有太大的差异,通常 UV 量和比 IP 量高出一点,每个 UV 相对于每个 IP 更准确地对应一个实际的浏览者。
①UV 大于 IP
这种情况就是在网吧、学校、公司等,公用相同 IP 的场所中不同的用户,或者多种不同浏览器访问网站,那么 UV 数会大于 IP 数。
②UV 小于 IP
一般的家庭网络中,大多数电脑使用 ADSL 拨号上网,所以同一个用户在家里不同时间访问网站时,IP 可能会不同,因为它会根据时间变动 IP,即动态的 IP 地址,但是实际访客数唯一,便会出现 UV 数小于 IP 数的情况。
实例说明
例如,在家用 ADSL 拨号上网,早上 8 点访问了 www.binghe.com
下的 2 个页面,下午 2 点又访问了 www.binghe.com 下的 3 个页面。那么,对于 www.binghe.com 来说,今天的 PV、UV、VV、IP 各项指标该如何计算?
计算 PV
PV 指浏览量,PV 数等于上午浏览的 2 个页面和下午浏览的 3 个页面之和,即 PV = 2 + 3。
计算 UV
UV 指独立访客数,一天内同一访客的多次访问只计为 1 个 UV,即 UV = 1。
计算 VV
VV 指访客的访问次数,上午和下午分别有一次访问行为,即 VV = 2。
计算 IP
IP 为独立 IP 数,由于 ADSL 拨号上网每次都 IP 不同,即 IP = 2。
性能指标
参考文档:性能指标:QPS、TPS、RT、吞吐量
QPS
QPS:Queries Per Second意思是“每秒查询率”,是一台服务器每秒能够相应的查询次数,是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准。互联网中,作为域名系统服务器的机器的性能经常用每秒查询率来衡量。
TPS
TPS:是 TransactionsPerSecond 的缩写,也就是事务数/秒。它是软件测试结果的测量单位。一个事务是指一个客户机向服务器发送请求然后服务器做出反应的过程。客户机在发送请求时开始计时,收到服务器响应后结束计时,以此来计算使用的时间和完成的事务个数。
QPS vs TPS:
QPS 基本类似于 TPS,但是不同的是,对于一个页面的一次访问,形成一个 TPS;但一次页面请求,可能产生多次对服务器的请求,服务器对这些请求,就可计入“QPS”之中。如,访问一个页面会请求服务器 2 次,一次访问,产生一个“T”,产生 2 个“Q”。
RT
响应时间:执行一个请求从开始到最后收到响应数据所花费的总体时间,即从客户端发起请求到收到服务器响应结果的时间。响应时间 RT(Response-time),是一个系统最重要的指标之一,它的数值大小直接反应了系统的快慢。
并发数
并发数是指系统同时能处理的请求数量,这个也是反应了系统的负载能力。
吞吐量
系统的吞吐量(承压能力)与请求对 CPU 的消耗、外部接口、IO 等等紧密关联。单个请求对 CPU 消耗越高,外部系统接口、IO 速度越慢,系统吞吐能力越低,反之越高。
系统吞吐量几个重要参数:QPS(TPS)、并发数、响应时间。
QPS(TPS):(Query Per Second)每秒钟 request/事务 数量
并发数: 系统同时处理的 request/事务数
响应时间: 一般取平均响应时间
理解了上面三个要素的意义之后,就能推算出它们之间的关系:
QPS(TPS)= 并发数/平均响应时间
并发数 = QPS* 平均响应时间
实际说明
我们通过一个实例来把上面几个概念串起来理解。按二八定律来看,如果每天 80% 的访问集中在 20% 的时间里,这 20% 时间就叫做峰值时间。
公式:( 总 PV 数 * 80% ) / ( 每天秒数 * 20% ) = 峰值时间每秒请求数 (QPS)
机器:峰值时间每秒 QPS / 单台机器的 QPS = 需要的机器
1、每天 300w PV 的在单台机器上,这台机器需要多少 QPS?
( 3000000 * 0.8 ) / (86400 * 0.2 ) = 139 (QPS)
2、如果一台机器的 QPS 是 58,需要几台机器来支持?
139 / 58 = 3
最佳线程数、QPS、RT - 这里我也没看懂,仅作参考
1、单线程 QPS 公式:QPS=1000ms/RT
对同一个系统而言,支持的线程数越多,QPS 越高。假设一个 RT 是 80ms,则可以很容易的计算出 QPS,QPS = 1000/80 = 12.5
多线程场景,如果把服务端的线程数提升到 2,那么整个系统的 QPS 则为 2*(1000/80) = 25, 可见 QPS 随着线程的增加而线性增长,那 QPS 上不去就加线程呗,听起来很有道理,公司也说的通,但是往往现实并非如此。
2、QPS 和 RT 的真实关系
我们想象的 QPS、RT 关系如下:
实际的 QPS、RT 关系如下:
3、最佳线程数量
刚好消耗完服务器的瓶颈资源的临界线程数,公式如下
最佳线程数量=((线程等待时间 + 线程 cpu 时间)/线程 cpu 时间) cpu 数量*
特性:
在达到最佳线程数的时候,线程数量继续递增,则 QPS 不变,而响应时间变长,持续递增线程数量,则 QPS 开始下降。
每个系统都有其最佳线程数量,但是不同状态下,最佳线程数量是会变化的。
瓶颈资源可以是 CPU,可以是内存,可以是锁资源,IO 资源:超过最佳线程数 - 导致资源的竞争,超过最佳线程数 - 响应时间递增。