Darío Gil, IBM Research: “Este año habrá el primer modelo de IA en español con casos de uso”

Darío Gil, vicepresidente de IBM y jefe de la división de investigación global de la compañía.

El cerebro humano es la estructura natural más compleja del universo conocido, con 86 mil millones de neuronas que transmiten 1.000 impulsos por segundo. Imitar aunque sea una parte de esa extraordinaria maquinaria biológica para aprender, comprender y responder en el español que hablan más de 500 millones de personas es la colosal tarea encargada por el Gobierno y en la que se ha embarcado el Barcelona Supercomputing Center (BSC) con su superordenador MareNostrum y la multinacional IBM, que pondrá a disposición del proyecto todo su potencial de programación, investigación e infraestructuras globales de inteligencia artificial.

Darío Gil, un murciano criado en Madrid que cumplirá 49 años en 2024, ha sido el principal valedor tecnológico de esta aventura al frente de la división de investigación global de IBM. Participa en esta entrevista poco después de la firma del acuerdo que dará lugar al primer gran modelo de lenguaje de inteligencia artificial nacido en español. Convencido de que este avance es exponencial y sólido –“una revolución”, proclama-, apuesta por una arquitectura abierta y colaborativa en la que quepa todo, desde las actas de las sesiones parlamentarias hasta la Real Academia Española o cualquier universidad o grupo de habla hispana. . Estima que el primer desarrollo podría mostrarse este año.

Preguntar. ¿Por qué IBM apuesta por la inteligencia artificial en español?

Respuesta. Nuestra visión sobre la inteligencia artificial nos permite alinearnos con la estrategia del Gobierno. Creemos firmemente que el futuro de la IA se creará y definirá a través de un ecosistema abierto y a diferencia de otras empresas. Sucedió con los sistemas operativos hace más de 20 años y se hizo bien en su momento. Era una apuesta decidida a que el futuro de los sistemas operativos, tanto en la supercomputación como para todos los sistemas distribuidos en Internet, etc., se basaría en el código abierto. Hemos llegado a la misma creencia y la comunidad quiere participar en la creación de inteligencia artificial.

P. ¿Cómo será la participación?

r. Crearemos entornos colaborativos para desarrollar modelos fundamentales basados en código abierto donde haya transparencia en los datos que se utilizarán para un preentrenamiento y una metodología. Es muy importante ir aumentando la capacidad de los modelos de forma discreta y día a día. Los modelos fundamentales existentes requieren de seis a nueve meses de capacitación previa y lanzamientos una vez al año. Si tenemos una plantilla central para toda la comunidad de desarrolladores, para todos los que quieran añadir conocimientos o habilidades, trabajaremos juntos para crear las mejores plantillas centrales abiertas en español y en idiomas cooficiales.

Si hay burbuja es una burbuja catastrófica, pero la base tecnológica de la inteligencia artificial es poderosa y sólida

P. ¿Cómo se desarrollará?

R. Desde una perspectiva de TI, utilizaremos las capacidades existentes en el BSC. Con su MareNostrum existe el compromiso del ministro (para la Transición Digital, José Luis Escrivá) de seguir invirtiendo para acelerar la transición de MareNostrum 5 a 6. Por nuestra parte, aportamos centros de supercomputación dedicados a la inteligencia artificial y a los últimos avances en Investigación de IBM.

P. ¿Cuáles son los sectores prioritarios afectados por el modelo?

r. A todos, pero al Gobierno le interesa que se beneficien las pequeñas y medianas empresas, donde hay mayor inhibición o complejidad para adoptar este tipo de innovaciones, y la Administración del Estado. Hemos definido casos de uso para implementar la difusión de la inteligencia artificial en estos dos sectores.

El modelo utilizará datos públicos, pero existe el deseo de utilizar documentos de propiedad estatal, lo cual es una cuestión muy singular e interesante. Las transcripciones de todos los debates parlamentarios son un ejemplo de ello.

P. ¿Cuánto cuesta?

r. No hay una respuesta concreta. Pero, si sirve como aproximación, puedo decir que para crear un modelo fundamental de alto rendimiento se necesitan miles de unidades de procesamiento, cada una de las cuales cuesta al menos 35.000 dólares (32.300 euros). Son proyectos muy ambiciosos; No se trata de dos personas hablando una tarde y haciendo un PowerPoint. IBM Research emplea a 3600 científicos e ingenieros, y nuestros equipos de supercomputación se centran exclusivamente en la construcción de modelos fundamentales. Y, al ser un sistema abierto, habría que sumar la comunidad de desarrolladores de habla hispana que deseen participar. Son esfuerzos que van de la mano.

P. ¿De dónde vendrán los datos para alimentar el modelo?

r. Serán datos públicos, pero existe el deseo de utilizar documentos que son propiedad del Estado, lo cual es un tema muy particular e interesante. Las transcripciones de todos los debates parlamentarios son un ejemplo de ello. Pero también se prevé la colaboración de bibliotecas nacionales y de la Real Academia Española. Serán datos públicos.

Puedes pedirle al modelo respuestas acordes con la experiencia argentina y él se comportará así, aprenderá del contexto desde el que se genera la interacción.

P. ¿Y cómo podemos salvar la diversidad de hispanohablantes?

r. Desde el punto de vista matemático se pueden incorporar una gran diversidad de lenguajes. La diversidad está dentro de la misma red neuronal y por lo tanto, cuando la ajustes (adaptación o mejora), se adapta, aunque haya sido formado con los documentos básicos, a las diferentes variaciones del español. Puedes pedirle al modelo respuestas acordes con la experiencia argentina y él se comportará así, aprenderá del contexto desde el que se genera la interacción.

P. Pero “pedir una cita” en español puede no tener el mismo significado en algunos países latinoamericanos, por poner un ejemplo de un caso de uso administrativo.

r. El modelo básico crecerá, se especializará y adquirirá habilidades con el compromiso de todos para comprender contextos específicos. El modelo de código abierto permite esta enorme diversidad. Y el objetivo es expandirlo tanto como sea posible, incluso en Brasil. Iberoamérica es un enorme mercado de oportunidades y es importante explotar la ventaja competitiva del español.

El objetivo es ampliarlo tanto como sea posible, incluso en Brasil. Iberoamérica es un enorme mercado de oportunidades y es importante aprovechar la ventaja competitiva del español

P. ¿Cuándo estará disponible el primer modelo?

R. El objetivo es hacer algo este año y, en paralelo, desarrollar algunos casos de uso en el mismo período. En este mundo (de la inteligencia artificial), que es muy dinámico, a nadie le interesan plazos de años.

P. ¿Y qué gana IBM con esto?

R. Daré el ejemplo de Red Hat (empresa multinacional de programación de código abierto cuya empresa matriz es IBM). Factura miles de millones de dólares cada año y es la empresa más grande del mundo. Software abierto. El modelo es facilitar el programa a empresas y gobiernos que luego querrán un mantenimiento o seguridad compatible con el equipo. Estamos acostumbrados a ese modelo de negocio. No lo hacemos porque seamos altruistas, sino porque creemos en ese modelo. Queremos socios estratégicos y hemos encontrado muchas resonancias en el gobierno español. En la alianza de IA que tenemos hay más de 80 instituciones que forman parte de este esfuerzo.

P. ¿Existe una burbuja de inteligencia artificial?

r. La tecnología en sí está evolucionando a un ritmo que nunca he visto hacerlo en nada más. Y ya no planificamos para uno o dos años, sino para dentro de un mes, semanas o días. No veo una burbuja. Si lo hubiera, sería catastrófico, pero la base tecnológica es potente y sólida.

puedes seguir La tecnología de EL PAÍS En Facebook Y X o regístrate aquí para recibir el nuestro boletín semanal.

Regístrate para continuar leyendo

Leer sin límites

Más Información