Inicio ELO & Chess Style
Estilo y fuerza de juego

ELO

Depende de la versión, pero su fuerza de juego va mejorando en las sucesivas versiones. Aquí os dejo una gráfica con el ELO aproximado del programa en sus diferentes versiones, según CCRL:

(Elo calculado por testeadores independientes. Elo aproximado, puede sufrir variaciones en el tiempo)

A modo ilustrativo, se muestra en otro color cuál es su fuerza de juego en relación a otros programas muy conocidos. Para compararlo con la escala de ELO FIDE, habría que sumarle +100 puntos a esta escala. Eso significa que Rhetoric tiene una fuerza de juego similar a la de un Gran Maestro.

Estilo

Rhetoric no es el programa más fuerte del mundo. Los hay más fuertes (aunque cada vez quedan menos :D). Pero lo que hace especial a Rhetoric es su función de evaluación posicional.

Rhetoric ha aprendido a jugar por sí mismo siguiendo varios métodos de autoaprendizaje:

  • En las primeras versiones (0.10.d y Lite), Rhetoric aprendió a jugar al ajedrez a partir de una selección de partidas de Karpov contra Grandes Maestros de la élite mundial (Anand, Kasparov, Adams, Gelfand, Bareev, Polgar, etc). Se siguió un algoritmo de aprendizaje semi asistido usando algoritmos genéticos para intentar determinar gran parte de los pesos de la función de evaluación. El proceso trataba de imitar las jugadas realizadas por los maestros. El proceso intentaba quedarse con los parámetros de la evaluación que proporcionaban una mayor tasa de aciertos sobre un total de 17.000 posiciones.
  • Posteriormente se desarrolló un proceso que combinaba los algoritmos genéticos con los resultados de partidas, donde la bonanza de una versión se estimaba mediante torneos KO, en las que en cada ronda jugaban N versiones diferentes de Rhetoric, y un intento guiar las mutaciones del genoma hacia regiones del espacio que tenían tendencia a ganar. El proceso era muy largo, y después de algún tiempo descubrí que los datos estaban distorsionados por errores de programación dentro del propio Rhetoric. Se invirtió mucho tiempo en corregirlos, lo que dio paso a las versiones 1.0 y 1.1.
  • La versión 1.2 ha introducido un enfoque distinto a la hora de aprender. En lugar de jugar muchas partidas durante el aprendizaje, las partidas se juegan al inicio, y después el proceso trata de minimizar el error de la función de evaluación. Este cálculo del mínimo error usa un algoritmo de búsqueda, en lugar de un algoritmo genético. Es considerablemente más rápido que el proceso anterior, pero ambos son combinables. Seguramente se combinen en algún momento.

Todo esto hace que el estilo de juego de Rhetoric sea único en todo el mundo, ya que ni yo mismo entiendo por qué Rhetoric ha deducido algunas de sus evaluaciones.

Lo asombroso de todo esto es que se han implementado muy pocos conceptos posicionales, faltan muchos, pero los que están parecen estar bien ponderados. Rhetoric es capaz de dar mate con torre y rey contra rey ¡Sin tener programado ningún concepto posicional al respecto! Símplemente, lo ha deducido de las partidas de ejemplo que se le han aportado.

Actualmente, Rhetoric  a menudo realiza sacrificios de material por conceptos posicionales como la actividad de piezas, control de columnas, colocar torres en séptima, mantener (o potenciar) la pareja de alfiles, crear peones pasados... o lo más divertido de todo: ¡atacar al rey contrario!

Aquí os dejo algunas partidas que describen su estilo con un ejemplo. Nótese que sus contrincantes son otros programas realmente fuertes.

 
Diseño web y motor de ajedrez por Alberto Sanjuan