Hace un mes, la compañía de inteligencia artificial DeepMind (filial de Google/Alphabet) anunció al mundo la creación de AlphaCode, una IA capaz de rendir como un desarrollador promedio al enfrentarse a problemas de programación.
Esto fue, por supuesto, bien recibido en la industria tecnológica, pues abría toda una serie de posibilidades a la hora de ejercer como asistente de usuarios (no necesariamente programadores) humanos. Sin embargo, el problema de modelos de IA como AlphaCode es, como explica un grupo de investigadores de la Univ. Carnegie Mellon, que
"los modelos de programación [mediante IA] más potentes es que no están disponibles públicamente: esto impide la aplicación de dichos modelos fuera de las empresas más grandes, y limita la investigación en este campo para las organizaciones con menos recursos".
De hecho, un estudio realizado en 2020 por la startup AI21 Labs establecía el coste de entrenar un modelo generador de código con 1.500 millones de parámetros (es decir, aproximadamente la mitad de complejo de PolyCoder) en los 80.000-1,6 millones de dólares. Por su parte, soluciones como GitHub Copilot cuenta con 12.000 millones de parámetros.
En Genbeta
El uso de código abierto para entrenar la IA de GitHub Copilot abre una polémica sobre qué licencia aplicar al software que genera
PolyCoder fue creado para democratizar la investigación en IAs programadoras
Y por esto, estos investigadores (Frank Xu, Uri Alon, Graham Neubig y Vincent Hellendoorn) venían trabajando desde hace …