Home » » Phân tích và thống kê dữ liệu bằng AWStats

Phân tích và thống kê dữ liệu bằng AWStats

Chắc hẳn các bạn Seoer đã quá quen thuộc với công cụ phân tích google analytics của google, thế nhưng công cụ này chưa hẳn đã đáp ứng hết nhu cầu phân tích của chúng ta. Đôi khi tôi vẫn tự hỏi : 
1. Tôi là một người làm SEO chuyên nghiệp, tôi không chỉ SEO trên bộ máy tìm kiếm là Google, tôi còn SEO trên các bộ máy tìm kiếm khác là Yahoo và Bing, làm thế nào để biết 2 bộ máy tìm kiếm này truy suất vào website của tôi bao nhiêu lần?

2. Tôi đang thực hiện chiến dịch quảng cáo và có mua một số bài viết của đối tác, tôi có đính kèm các tài liệu giới thiệu dịch vụ, làm thế nào để tôi biết được tài liệu này có bao nhiêu lần tải?

3. Website của tôi đang hoạt động ổn định, nhưng vừa rồi tôi có thay đổi giao diện, tôi có cập nhật một số tính năng nhưng không chắc nó đã hoạt động tốt. Liệu có xuất hiện các thông báo 206, 301, 302, 404, 401, 500,… không ? Và xuất hiện bao nhiêu lần trên website của tôi?

4. Và cuối cùng tôi tự hỏi bản thân mình một điều là Google Analytics có giải đáp hết những câu hỏi bên trên của tôi không?

Mình đã tự trả lời câu hỏi này bằng cách kiểm tra Logs của Website, và thế là mình đã tìm ra công cụ để trả lời câu hỏi này.
Mình xin giới thiệu với các bạn SEOer và Webmaster công cụ mang tên AWStats , rất phổ biến và miễn phí, đã được cài đặt trên rất nhiều máy chủ

. Trong bài viết này, sẽ demo công cụ này trên cPanel.



Để bắt đầu bạn cần đăng nhập vào cPanel, rồi click vào biểu tượng AWStats như hình bên dưới, sau đó chọn domain cần xem.

Nếu tài khoản của bạn không thấy biểu tượng này, bạn cần liên hệ với nhà cung cấp dịch vụ để họ mở cho bạn. Hoặc nếu bạn chạy server riêng nhưng không thấy thì hãy đăng nhập vào WHM > Server Configuration > Statistics Software Configuration để kích hoạt tính năng này.


Hình bên trên đây là tổng quan giao diện của AWStats, với các con số thống kê bao gồm traffic, visit, hits, bandwidth,… rất chi tiết. Những con số bên trên đây thể hiện quá trình phát triển của website từng ngày, các con số này đảm bảo độ chính xác tuyệt đối vì nó là Logs, mà đã là Logs thì không có chuyện giả mạo hay sai lệch được. Mình ví dụ trường hợp rất kinh điển đó là việc các Hacker khi tấn công vào hệ thống, họ đều xóa Logs truy cập để tránh bị phát hiện, bởi vì qua Logs nó đã mô tả quá trình thực thi của họ.

Để trải nghiệm rõ hơn về AWStats, bạn truy cập vào địa chỉ này: http://www.nltechno.com/awstats/awstats.pl?config=destailleur.fr

I. Thống kê truy cập.

Thống kê truy cập theo giờ, ngày, tháng. Hình bên dưới đây là biểu đồ thể hiện truy cập theo từng giờ, kèm theo là lượng băng thông mà máy chủ xử lý.


Thống kê truy cập từ các quốc gia, ip nào truy suất nhiều nhất, để có cái nhìn tổng quan bạn bấm vào chữ Full List. Tại đây có một mẹo nhỏ bạn có thể kiểm tra xem ip nào truy suất vào website mình nhiều nhất, với truy cập bình thường họ không request quá nhiều nên số Hits vừa phải. Còn những IP nào với ý đồ DOS (tấn công từ chối dịch vụ) sẽ request liên tục, cần phải chặn ngay nếu không muốn mất băng thông vô ích. Hình bên dưới bạn sẽ thấy IP 78.224.121.19 từ Pháp request rất lớn, nếu chúng ta đang SEO trên Google.com.vn mà IP từ Pháp truy cập với cường độ cao như vậy phải xem xét lại.


II. Robots, Spider, Time on Site.

Thống kê truy cập vào vập tin robots.txt của các bộ máy tìm kiếm bao nhiêu lần, qua đó xuất ra băng thông mà máy chủ đã xử lý.

Mình quay trở lại câu hỏi số 1 như sau: Tôi là một người làm SEO chuyên nghiệp, tôi không chỉ SEO trên bộ máy tìm kiếm là Google, tôi còn SEO trên các bộ máy tìm kiếm khác là Yahoo và Bing, làm thế nào để biết 2 bộ máy tìm kiếm này truy suất vào website của tôi bao nhiêu lần?

Ảnh chụp bên trên nhìn vào khá rõ các bộ tìm kiếm, ví dụ đầu tiên là Yahoo, Googlebot, MSNBot và có cả Alexa nữa (không có Bingbot bởi vì phiên bản AWStats trên server mình khá cũ nên nó chưa hiểu được). Còn đây ảnh chụp trên Google Analytics, không thấy show ra kết quả từ bộ máy tìm kiếm Yahoo, chỉ thấy có traffic từ hòm mail yahoo mà thôi.

III. Tập tin và số lần truy suất.

Thống kê số lần truy cập các tập tin như png, js, css, jpg, pdf, zip,… bao nhiêu lần tải về, tải về thất bại bao nhiêu lần, cũng như băng thông. Trong phần này, mình sẽ phân tích câu hỏi số 2: Tôi đang thực hiện chiến dịch quảng cáo và có mua một số bài viết của đối tác, tôi có đính kèm các tài liệu giới thiệu dịch vụ, làm thế nào để tôi biết được tài liệu này có bao nhiêu lần tải?

IV. Trình duyệt và mã trạng thái máy chủ.

Tại đây AWStats sẽ thống kê trình duyệt hỗ trợ Java, Flash, Audio,… truy cập vào website của bạn bao nhiêu. Phần này nói chung không quan trọng lắm, vì hầu như hiện nay đa số trình duyệt đã hỗ trợ các tính năng bên dưới.

HTTP Status codes: thống kê các mã trạng thái máy chủ, cái này rất phổ biến có rất nhiều bài viết như thông báo 404, chuyển hướng URL 301, 302

​Mình quay trở lại câu hỏi số 3: Website của tôi đang hoạt động ổn định, nhưng vừa rồi tôi có thay đổi giao diện, tôi có cập nhật một số tính năng nhưng không chắc nó đã hoạt động tốt. Liệu có xuất hiện các thông báo 206, 301, 302, 404, 401, 500,… không ? Và xuất hiện bao nhiêu lần trên website của tôi?

Nhìn hình bên trên bạn có thể thấy rất rõ:

21,258 Hits chuyển hướng 301 vĩnh viễn.

2,444 Hits chuyển hướng 302 tạm thời.

8,703 Hits thông báo lỗi không tìm thấy 404.

36 Hits thông báo lỗi máy chủ Internal server Error.

Bạn có thể tham khảo thêm tài liệu về mã trạng thái máy chủ cũng như thuật ngữ tại đây:http://awstats.sourceforge.net/docs/awstats_glossary.html

Mình tiến hành phân tích để sửa các lỗi 404 không tìm thấy trên Mần SEO.


Mình đã đánh dấu khoanh đỏ các vùng để giải thích, cột bên trái URL chứa tập tin không tìm thấy, cột bên phải là Referrers thể hiện nguồn truy suất tới. Giải thích đơn giản là:

Nguồn:forum.idichvuseo.com/threads...an-tich-lien-ket-ua-thich-cua-gioi-seo.21298/

404: /wp-content/uploads/2013/07/newlost-1024x559.png

Số lần gọi tới là 135 lần.​

Demo 2 với URL: /khong-lam-seo-thi-man-seo.html&&&&&&&

Có 51 thông báo 404 không tìm thấy ở trường hợp này.

Demo 3 với URL: /khong-lam-seo-thi-man-seo.html$$$$$$$

Có 29 thông báo 404 không tìm thấy ở trường hợp này.

Qua bài viết này, mình muốn gửi đến các bạn làm SEO một cái nhìn tổng quan về thống kê dữ liệu. Có thêm công cụ để phân tích thì mình có thể dễ dàng tìm ra lỗi hệ thống, hoặc tính toán giá trị chuyển đổi tốt hơn.








































0 nhận xét:

Post a Comment