Vấn đề của các phép benchmark di động và những con số đó là chúng không phản ánh chính xác trải nghiệm thực tế khi bạn mua điện thoại về và cầm sử dụng nó hằng ngày. Một cái điện thoại hay tablet với điểm cao chưa chắc mang lại cho bạn trải nghiệm mượt mà như bạn mong đợi. Chưa kể ngày nay các nhà sản xuất còn có thể gian lận, hay gọi cách văn vẻ là “tối ưu” điểm benchmark để chiếc máy của họ trông hấp dẫn hơn trong mắt những người đang có ý định bỏ tiền ra mua trong khi thực tế chúng không đạt mức cao như vậy. Điểm benchmark chỉ đơn giản là những con số tham khảo và bạn hoàn toàn có thể bỏ qua chúng lúc tìm hiểu thông tin để chuẩn bị cho việc sắm một chiếc điện thoại hay tablet mới.

Hãy lấy 1 ví dụ do chính ARM – hãng làm ra những con chip đang chạy trong đa số các điện thoại và máy tính bảng trên thị trường – thu thập được. Biểu đồ bên dưới nói về lượng tài nguyên cần thiết để duy trì nhiều loại nội dung khác nhau, từ web, game cho đến giao diện người dùng… chạy mượt ở mức 60fps tại độ phân giải 1080p. Mức 60fps cũng là con số được cho là “mượt” và đang được xài để benchmark game trên máy tính, còn độ phân giải 1080p là tạm ổn, bây giờ là 2K cho các máy cao cấp.

Chấm và đường màu đỏ là các mức tài nguyên mà công cụ benchmark yêu cầu (tính trung bình trên tất cả các công cụ), những đường và chấm còn lại là tài nguyên thực tế. Dựa vào đây, bạn có thể thấy là các tool benchmark kéo máy tài nguyên lên cao hơn rất nhiều so với bình thường. Với tất cả những tác vụ mà bạn thường sử dụng như chơi game 2D, 3G, lướt web, thậm chí khi bạn kết hợp tất cả mọi loại nội dung lại với nhau thì lương CPU và băng thông RAM yêu cầu cũng không bằng một góc so với những gì mà tool benchmark sử dụng để đo.

Biểu đồ trên đã chứng minh rằng các tool benchmark không phản ánh đúng sự thật về trải nghiệm của bạn khi sử dụng thực tế. Nó chỉ đơn giản là đang kéo phần cứng lên mức cao nhất có thể, tiêu hao nhiều nhất có thể.

Tới đây có thể bạn sẽ nói là: Ồ vậy điểm benchmark vẫn có ý nghĩa mà, nó sẽ cho biết hệ thống mạnh nhất ra sao, so với các máy khác khi chạy ở cường độ mạnh nhất thì sẽ như thế nào. Không đâu, mọi chuyện không đơn giản như vậy.

Vấn đề thứ nhất: nghẽn cổ chai. Quay trở lại biểu đồ trên, bạn có thể thấy nhiều bài test benchmark đẩy băng thông RAM lên mức cực kì cao, và đây thường là một nút thắt cổ chai đối với thiết bị di động. Khi các phép benchmark dồn quá nhiều dữ liệu cần xử lý vào một con đường đi tới CPU và GPU mà con đường này không đủ rộng hay tốc độ xe chạy không đủ nhanh, nó sẽ gây kẹt xe cục bộ. Lý do đơn giản là vì con đường này chưa bao giờ được thiết kế để đảm đương một lượng xe lớn đến như vậy, trong khi bình thường chẳng bao giờ có chuyện xe đi hết đường cả. Một số phép benchmark chia bài test của nó thành nhiều đợt để giảm tình trạng nghẽn cổ chai nhưng cũng không mang lại cái nhìn đúng nhất về máy.

Vấn đề thứ hai: mỗi bài test chỉ dùng để đo một khía cạnh cụ thể của CPU và GPU mà thôi. Ví dụ, nhiều tool bechmark 3D nhét thật nhiều đa giác vào một khung hình để giả lập lại lượng công việc nặng mà chip cần xử lý. Nhưng CPU và GPU không chỉ được thiết kế để làm mỗi trò này, chúng còn được tạo ra để chạy nhiều tác vụ khác nhau và những tác vụ này trong thực tế sẽ xuất hiện cùng lúc với nhau. Bạn có thể xem tình huống này giống như việc bắt một con mèo leo cây để xem nó leo nhanh tới đâu trong khi nó còn nhiều tài năng khác có thể dùng kèm với vụ leo trèo: khả năng bắt mồi, khả năng bám dính, tốc độ chạy, độ bật nảy… Nói cách khác, các phép đo cũng không phản ánh được đúng thực tế.

AnTuTu và Geekbench có lẽ là 2 công cụ đo lường được nhiều người xài nhất hiện nay. Thỉnh thoảng đi ra tiệm bán điện thoại bạn sẽ thấy có vài người đứng đo thử xem máy được bao nhiêu điểm, sau đó mới quyết định có mua hay không. Nhưng theo Forbes, “vấn đề của các công cụ này đó là nó chỉ đo một số thành phần nhất định của SoC hoặc một vài linh kiện như RAM mà không để ý đến cách smartphone sẽ chạy như là một hệ thống hoàn chỉnh”. Các tool benchmark không tính đến ảnh hưởng của bộ giao diện với cảm giác của người dùng, không tính đến việc chạy các app nặng sẽ ảnh hưởng ra sao đến những tiến trình còn lại trong máy.

Đó là chưa kể đến việc các phép benchmark này còn có thể bị gian lận như vụ khui scandal đình đám của Anandtech mà HTC, LG, Asus, Samsung đều có mặt trong danh sách bị phát hiện. Mới đây OnePlus 5 cũng bị cho là không trung thực không tối ưu điểm số benchmark trên các máy gửi cho reviewer.

Kinh nghiệm cá nhân mình cũng hoàn toàn giống với phân tích ở trên. Có những cái điện thoại khi benchmark ra thì điểm cao lắm, ấn tượng lắm, nhưng khi sử dụng mới thấy hệ thống chậm chạp, phản hồi cực kì kém. Một số máy thì chỉ sau một thời gian nhắn sử dụng sẽ thấy ngay sự biến đổi này. Nhiều hãng đều dính vấn đề như vậy, từ Samsung, LG cho đến HTC, Oppo. Gần đây tình trạng chậm đó đã được cải thiện rất nhiều trên các thiết bị mới, nhưng các con số benchmark cao ngất ngưởng vẫn chưa chứng minh 100% được rằng máy của bạn sẽ chạy nhanh.

Do đó, mình chỉ tin vào cảm giác và nhận định của mình khi xài thử một cái điện thoại nào đó và trong khoảng 4 năm trở lại đây mình đã không còn benchmark điện thoại khi test và chuẩn bị viết review cho anh em xem nữa. Dù sao thì cái mà bạn thật sự cảm nhận được cũng đâu phải là điểm benchmark đâu, nó là cái mặt bạn nhìn thấy, tay bạn cảm nhận được cơ mà.

ARM có một bộ đo chuẩn dành cho chip của mình, và nó bao gồm việc phản hàn dây vào mainboard của điện thoại để đo đủ thứ linh kiện trong quá trình chạy test nhằm đảm bảo bài test sát với thực tế nhất. Đây là chuyện bạn không thể tự làm ở nhà, và đương nhiên là kết quả đưa ra rất khác so với việc bạn bấm một nút trên AnTuTu.

Về vụ này thì mấy anh The Verge cũng đồng tình với mình, mấy ảnh nói như sau: “bechmark chưa bao giờ kể đầy đủ câu chuyện”. The Verge không nói nhiều tới các phép đo về hiệu năng nhưng nói về điểm DxO Mark Mobile, và họ than phiền rằng chiếc HTC 10 tuy được 93 / 100 điểm về khả năng tự lấy nét nhưng máy vẫn focus rất chậm (mình xài HTC cũng bị y chang), sau đó HTC thậm chí đã phải phát hành một bản vá để khắc phục vấn đề này.

Hay như trường hợp của LG G4 và iPhone 6 Plus, chúng cũng được điểm DxO cao đấy, nhưng ngoài ra trong top đầu còn có Nextbit Robin với 81 điểm, trong khi chiếc máy này bị chê camera tơi tả và máy ảnh được xem là một trong những điểm yếu nhất của thiết bị. DxO sẽ cho bạn biết phần cứng của một cái camera có ngon hay không, còn phần mềm và thuật toán xử lý lại là một câu chuyện rất khác, và trải nghiệm chụp ảnh của bạn lại là một thứ khác nữa.

Nên nhớ rằng các phép đo như của DxO luôn được tiến hành trong một môi trường được kiểm soát chặt chẽ, và mức độ phơi sáng, độ tương phản của đồ vật, màu sắc của bản màu test… của họ không thể nào giống với việc bạn xách một cái điện thoại ra đường đi chụp lòng vòng được. Chính vì thế, cũng như khi kiểm tra hiệu năng CPU / GPU, cách tốt nhất để biết camera trên một chiếc điện thoại chụp có đẹp hay không là xách máy ra bắn phá và dùng ảnh nói chuyện. Chỉ có trải nghiệm thực tế mới là cái đáng quan tâm mà thôi.

Tóm lại, điểm benchmark chỉ đơn thuần là một công cụ để tham khảo, thử nghiệm là chính, và giá trị của nó với trải nghiệm thực tế mà bạn sẽ dùng hằng ngày trên chiếc điện thoại hay tablet của bạn là không nhiều. Hãy bớt tin tưởng vào các con số benchmark và hãy tin vào đôi mắt, bàn tay của mình. Chỉ có bạn mới đánh giá chính xác được một cái máy có chạy nhanh hay không, có mượt hay không. Và đừng bao giờ để điểm benchmark ảnh hưởng tới quyết định mua hàng của bạn.

Tham khảo: Android Authority, Forbes, The Verge​