
Pillados con las manos en la masa
La credibilidad de los benchmarks es fundamental para evaluar hardware, pero una herramienta de optimización poco conocida de Intel ha generado una fuerte polémica. El Binary Optimization Tool (BOT), compatible con los procesadores Core Ultra 200 Plus (Arrow Lake refresh) y Core Ultra 300 (Panther Lake), fue detectado inflando artificialmente resultados de Geekbench. Como respuesta, Primate Labs lanzó Geekbench 6.7 con mecanismos para detectar y anular estas pruebas.
El “escándalo” de la optimización selectiva
BOT se presentó inicialmente como una utilidad de Windows destinada a mejorar el rendimiento en juegos y apps concretas. Sin embargo, desarrolladores descubrieron que también identificaba Geekbench mediante checksums y recompilaba el ejecutable con optimizaciones específicas.
El problema es que el software optimiza el benchmark, pero no la experiencia real del usuario cuando usa el software real, que es justamente lo que el benchmark de Geekbench busca evaluar. Por lo tanto, dado que BOT funciona solo con unas pocas aplicaciones, el benchmark genera una imagen irreal del rendimiento diario, dificultando una comparación justa frente a chips antiguos o competidores como AMD y Apple.
¿Cómo funciona BOT?
Pruebas realizadas en un portátil Panther Lake mostraron resultados llamativos:
- Geekbench 6.3 con BOT activado subió un 5.5% en puntuaciones generales.
- Algunas cargas específicas mejoraron hasta en un 30%.
- BOT vectoriza agresivamente el código:
- Instrucciones escalares: –62%
- Instrucciones vectoriales: +1366%
- Instrucciones totales: –14%
El coste de estas optimizaciones es un tiempo de espera inicial de hasta 40 segundos, la primera vez que se ejecuta el benchmark.
Geekbench 6.7 contrataca
La nueva versión introduce detección automática del BOT. Si se encuentra activo:
- Los resultados se marcan como inválidos.
- No se pueden comparar con la base de datos global.
- Como BOT ya no reconoce el ejecutable nuevo de Geekbench, las puntuaciones permanecen prácticamente iguales con o sin la herramienta.
Además, Geekbench marcará como poco fiables los resultados de versiones 6.6 o anteriores en Windows.
Otras mejoras del benchmark
Geekbench 6.7 también incorpora mejoras adicionales:
- Identificación más precisa de SoC en Android
- Soporte mejorado para RISC-V
- Mayor estabilidad en Linux ARM multi-hilo
Un golpe a la confianza en los benchmarks
BOT demuestra ser técnicamente impresionante, pero su enfoque selectivo rompe la comparabilidad real entre procesadores. Con Geekbench 6.7, la industria vuelve a poner el foco en la transparencia y la equidad en las pruebas de rendimiento. Esto son malas noticias para Intel.

Deja una respuesta