“a veces La inteligencia artificial no entiende cosas elementales”
Al Argentino Héctor Geffner, uno de los referentes globales de la ia, le Preocupan más sus usos que sus CAPACIDADES
— texto de Esteban Lafuente —
El boom del CHATGPT es apenas uno de los múltiples desarrollos que depositaron a la inteligencia artificial en el centro de la agenda que viene. Y ese universo cuenta con un argentino entre sus referentes globales. Con una carrera de estudios y docencia entre Venezuela, Israel y Barcelona, Héctor Geffner es uno de los académicos más reconocidos del mundo en la materia. Formado como ingeniero electrónico y con un doctorado en Inteligencia Artificial por la Universidad de California en Los Ángeles (UCLA), el año pasado recibió la prestigiosa beca de la fundación Alexander von Humboldt en Alemania, y desde 2023 es chair y líder de investigación en la cátedra de Machine learning and reasoning de la RWTH Aachen, en el suroeste de Alemania.
“Es una cátedra que se abrió con mi incorporación, y básicamente estoy armando un equipo en la ciudad, reclutando gente y haciendo docencia”, cuenta Geffner en diálogo con la nacion. Nacido en Lomas de Zamora, se fue de la Argentina poco después de cumplir 18 años, en 1977, en plena dictadura, y completó sus estudios en Venezuela. Ese fue el inicio de su carrera profesional que se desarrolló hasta hoy íntegramente en el exterior. “Sigo en contacto con la Argentina, viajo seguido. Mi contacto académico es limitado porque terminé mi grado afuera, pero tuve algunos cursos en la UBA. Y obviamente ver los vaivenes del país no es algo bueno”, dice Geffner, cuyo hermano Jorge es doctor en bioquímica e investigador del Conicet.
El galardón de la Fundación Von Humboldt consolidó a Geffner entre los científicos referentes de Europa en el campo de la inteligencia artificial, un espacio que atraviesa diferentes dimensiones de la vida humana y es considerado por muchos como un factor que podría alterar el mundo como lo conocemos hasta ahora.
“Uno de los grandes desafíos abiertos es cómo acoplar todo lo que es hoy el deep learning, que se hizo muy famoso con herramientas como el CHATGPT, con algún tipo de razonamiento para tener algún tipo de confiabilidad, cosa que hoy día no tienen. Estas empresas, como Openai (creadora de CHATGPT), y otras, tienen equipos y financiamiento mucho más allá de lo que tienen las universidades, pero el tipo de investigación no es tan distinto. Una de las diferencias es que las empresas están interesadas en llegar a mucha gente y eventualmente hacer dinero, y a la universidad le interesa investigar para seguir entendiendo cosas. La industria, en cambio, mira mucho qué hace la competencia y se focaliza en seguir sacando cosas cuando una le come market share”, dice Geffner, quien advierte por las limitaciones del desarrollo de estas herramientas y los riegos que conlleva esta evolución.
–¿Por qué habla de la no confiabilidad de las herramientas de inteligencia artificial?
–Interactuando con CHATGPT uno se da cuenta. A pesar de que muestra o da la impresión de que es inteligencia, a veces no entiende cosas elementales. El riesgo a veces es que es complicado confiar en estas herramientas, aunque ya está pasando, porque son sistemas que se usan para evaluar profesores, desempeño de empleados o la calificación de personas para entregar créditos. Exponen una cantidad de sesgos, que todos son conocidos, pero son muy usados. Por un lado, impresiona por la capacidad que tienen, pero por otro lado te das cuenta que no es nada parecido a la inteligencia humana, porque hay muchas cosas que están colgadas de alfileres. Por un lado, tiene comprensión enciclopédica, porque ha leído mucho más de lo que nosotros vamos a poder leer en nuestras vidas, pero la asimilación de lo leído no significa es comprensión profunda. En ese sentido, el tipo de técnica que usan estas herramientas, que es deep learning, que es aprendizaje profundo, es conocimiento, pero bastante superficial. –¿Cómo definiría el deep learning o machine learning?
–Estos programas basados en aprendizaje automático son programas basados que tienen ciertas entradas y salidas, el hallazgo, que ha pasado antes de esta ola del CHATGPT, es que se sabe que hay cierto tipo de programas que es más fácil aprenderlos que escribirlos a mano. En otras palabras, si yo te digo escribí un programa que dibuje en el papel los números del 0 al 9 y que pueda reconocer el dígito que yo escribí, escribir un programa que haga eso más o menos bien no solo es muy complicado, sino que además no ha funcionado. Son programas que no son robustos. Y estos sistemas que aprenden a hacer esa discriminación a partir de una enorme cantidad de datos, muchos ceros, muchos unos, dibujados de diferentes maneras, esos programas que hacen ese aprendizaje a partir de datos, en general son bastante más robustos. Estos sistemas como CHATGPT forman parte de estas cosas. Escribir algo que parecido a lo humano sería bastante difícil, pero hacerlo a partir de grandes volúmenes de datos, se puede hacer, incluso de una manera bastante sencilla, porque CHATGPT básicamente está basado en poder predecir de alguna manera la palabra siguiente para que los textos que se van generando suenen verosímiles, independientemente de que sean verdaderos o falsos. Es decir, que parezcan escritos como la cantidad de documentos, textos y libros que se han leído por ahí.
–Y eso también lleva a errores o repuestas falsas o inventadas
–A veces le pegará con datos reales, y a veces tendrá datos inventados. CHATGPT no sabe lo que es cierto de lo que es falso. Lo que sabe es los textos que ha procesado, pero no tiene conocimiento de los hechos más allá de esos textos, entonces el conocimiento de verdad o falsedad no lo tiene. Y hay un problema ahí.
–Estas herramientas se hicieron famosas con CHATGPT. Pero, ¿qué otra aplicación tiene el deep learning hoy?
–Cualquier persona que hoy tiene un teléfono móvil está usando cantidad de herramientas que involucran este tipo de programas, a partir de datos y machine learning. Yo vivo en Alemania, no hablo alemán. No tengo problemas para dar clases, porque son en inglés, pero recibo cantidad de comunicaciones en alemán que tengo que leer, y hay cantidad de programas que traducen de texto a texto y no lo hacen tan mal. Incluso sacándole una foto, reconocen el texto. Son aplicaciones que usamos en el teléfono, se basan en estas herramientas y las manejamos desde hace unos años. Quizás hace años, estas funcionalidades no se basaban en deep learning, pero desde hace un tiempo han barridos con otras técnicas alternativas.
–¿Cuál es su visión sobre el impacto de estas herramientas de deep learning e inteligencia artificial sobre el mundo del trabajo? ¿Pueden reemplazar a las personas en el trabajo?
–Pienso que hay un proceso desde la Revolución Industrial, o incluso antes, para acá, donde el desarrollo de diferentes tecnologías ha eliminado cantidad de trabajos. Cuando era chico, yo llamaba por teléfono, atendía una operadora, le tenía que decir que quería hablar con tal número y ella cruzaba los cables. Esos trabajos hace mucho que desaparecieron y no es algo que hoy extrañemos, porque hoy hacer una llamada es más sencillo. Y hay cantidad de trabajos, como los ascensoristas, o gente que prendía las luces en la calle hace un siglo. Muchos puestos o roles se crean y otros se destruyen, y en general son los países que más se han desarrollado tecnológicamente los que de alguna manera han creado más trabajo. Lo que sí está pasando hoy en día, y se dio también en otros momentos, es que tal vez las cosas pueden ser diferentes, porque se eliminan muchos trabajos y no necesariamente se crean otros, porque hay muchas cosas que se pueden hacer con software, y eso no está tan claro. Pienso que el tema de cuál es el impacto de desarrollo social es importante y en última instancia es político. La sociedad a través de su sistema político tiene que ir regulando y definiendo donde estos desarrollos convienen desde un punto de vista social, y donde no convienen.
–Desde un punto de vista personal o humano, ¿qué le genera trabajar con estas herramientas?
–En mi trabajo personal no estoy orientado a aplicaciones. Yo soy de los que hace ciencia. Mi trabajo es tratar de entender las cosas, las limitaciones de estos sistemas, en cuanto a si son confiables, cómo son los principios básicos, cómo se puede aprender a partir de datos o armar representaciones que te permitan razonar, cosas que hoy uno no tiene hoy en día. Hace años, las empresas de autos invierten una cantidad de dinero en autos que se conducen solos, pero pasan los años y no lo vemos en las calles, salvo en lugares donde no hay muchos autos. ¿Qué es lo que pasa? Es básicamente que estos sistemas basados en técnicas de aprendizaje son cajas negras en las cuales no se puede confiar. A diferencia de la caja negra que tenemos en la cabeza, que nos da sentido común.
Limitaciones –¿Cómo y dónde se da esa diferencia?
–Si voy en una ruta, aparece un chico corriendo detrás de un globo, uno puede predecir y sabe que tiene que frenar. Pero estos sistemas basados en machine learning no pueden de alguna manera interpretar lo que pasa afuera. Están limitados a los datos que tuvieron anteriormente. Y si entre esos datos no hubo situaciones de alguna manera parecidas, hay una limitación. están limitados a eso. Tiene que ver con lo que se habla en psicología de la concepción dual del pensamiento humano, con las teorías que popularizó Daniel Kahneman, que ganó un premio Nobel. Él habla de pensamiento rápido y pensamiento lento. La cajita negra del deep learning es totalmente reflejo y reactivo, no involucra algún tipo de deliberación o interpretación de lo que está afuera. La mente humana tiene facilidad para ver cuándo puede ir en modo automático y cuándo hay que detenerse y pensar qué está pasando. Incluso cuando uno está manejando su auto, va en modo automático, puede manejar y escuchar música o hablar a la vez, pero si tiene que estacionar en un sitio relativamente estrecho, se tiene que concentrar en esa maniobra, deja de conversar. Estos sistemas de deep learning no tienen nada parecido, están limitados al comportamiento reactivo. Y gente como yo trata de entender cómo es el razonamiento a través de modelos y este tipo de comportamiento más reactivo, que aprende a partir de datos, que son automáticos.
–¿Y qué potencial de desarrollo tienen?
–Estos sistemas pueden ser usados, como por ejemplo para jugar ajedrez. Una parte es acumulación de datos y otra es cuando adquieren un comportamiento bueno, donde logran vencer a campeones mundiales, es cuando empiezan a mirar para adelante, contemplan las movidas que se pueden hacer, las respuestas que puede hacer el oponente para decidir qué hacer en cada momento. Pero es limitado. En ajedrez, uno sabe la dinámica, qué jugadas se pueden hacer, qué efectos tiene jugada sobre configuración del tablero. Hay un modelo predictivo sobre cómo va evolucionando la situación a medida que uno va haciendo cosas. Muchos de estos sistemas no construyen esos modelos, sino solamente las reacciones, y los sistemas que hacen este tipo de razonamiento tienen modelos construidos a mano. El tema es cómo podemos utilizar las técnicas de aprendizaje para aprender modelos que te permitan razonar y balancear el comportamiento reactivo con el comportamiento deliberativo. Esa interacción es una característica de la inteligencia humana que estos sistemas todavía no tienen.
–Dijo “todavía”. ¿Pueden tenerlas en el futuro? ¿Qué perspectivas existen?
–Es difícil predecir tiempos para algo parecido. Una inteligencia, en la flexibilidad y la generalidad de una inteligencia humana, no está en el corto plazo. Y cuando se hablan de riesgos existenciales de estas herramientas, pienso que no es por las capacidades que tiene la inteligencia artificial actual de hacer gran daño de manera autónoma, pero pienso que los daños podrían venir de una herramienta siendo utilizada por humanos, que sus objetivos no estén bien alineados con los objetivos sociales. Se habla mucho de cómo tener inteligencia artificial, cuyos valores estén alineados con valores humanos, pero hay cantidad de cosas cuyos valores no están alineados con los intereses humanos, o donde los intereses de esas compañías no siempre están alineados con los humanos. Si a Youtube le conviene tenerte entretenido mirando videos y darte sugerencias de más videos que sean más extremos y con engancharte en más videos, lo va a hacer, porque sus preferencias están enfocadas muchas veces en eso. Mi preocupación con los riesgos tiene que ver hoy más con los usos que con las capacidades de la IA, que todavía dista mucho de la inteligencia humana, por más que en ciertos casos pueda ser mucho más capaz, como a la hora de jugar al ajedrez o interpretar una foto. La inteligencia humana tiene una capacidad de amplitud, generalidad y balancear aspectos que la IA por ahora no tiene, y nada parecido pienso que va a surgir en los próximos años.
–Sin embargo, el uso de IA con generación de videos e imágenes es cada vez más usual. ¿No ve un riesgo ahí?
–Sí, lo veo. Pero una cosa es la herramienta en sí y otra el uso de la herramienta. Los usos pueden estar totalmente regulados. Ahora también puedo agarrar un camión y embestir a un montón de gente, y ese no es un problema del camión. La IA tiene en parte un riesgo en sí misma, pero el tema de la manipulación de muchos discursos que hay hoy, donde se borran las barreras entre lo que es cierto de lo que es falso, o se termina cuestionando si una vacuna es o no efectiva, cuestiones que uno pensaba que estaban superadas. Pienso que es el uso de la herramienta, no la herramienta en sí.
Regulación –¿Debería estar regulada la IA?
–Pienso, como muchos de los investigadores, que los usos de la IA por parte de empresas tienen que estar regulados. Uno sube a un avión y tiene un montón de regulaciones. Uno compra un auto o un queso en el supermercado y hay reglas y regulaciones que tienen que cumplirse, y lo mismo tiene que aplicarse a la IA. Un texto o una imagen generada usando IA podría estar totalmente marcada, con una regulación que lo demande; que si se van a usar textos usados por CHATGPT, que quede de alguna manera documentado y cosas por el estilo. Hay una cantidad reglas en cuanto al uso de herramientas que afectan la vida de la gente, como herramientas para evaluar si se otorga un crédito, evaluar trabajadores y otra cantidad de cosas que, desde un punto de vista social, hay un gran interés que sean regulados, y no hay dudas en que deben estar reguladas. En Europa ese debate se ha movido un poco más activamente quizás que en los Estados Unidos, por más que allá también se hablan, y muchas de estas cosas están en plena discusión. De hecho, la manera en que estas herramientas se han desarrollado, como el CHATGPT, lo que se llama largelanguage models (LLM), y cómo hacerlos accesibles, se puede regular. Porque puede haber usos de manipulación masiva. Algo que viene sucediendo hace años, donde la IA tiene que ver, es el hecho de empresas que tienen información personalizada de los usuarios, y pueden hacer publicidad digital que esté totalmente adaptada y personalizada para hacerte comprar esto, votar por aquello. Es una propaganda muy poderosa. Tenés un sistema que se comporta como un amigo, pero no juega para vos, sino para empresas que quieren vender o tienen un objetivo comercial. Y obviamente es algo que tiene que ser regulado.
–¿Hay disputas geopolíticas, entre países, por el desarrollo de estas herramientas?
–Hay un tema de soberanía tecnológica. Muchos de estos desarrollos y las grandes empresas que los hicieron son norteamericanas y en Europa hay preocupación, porque uno no quiere tener dependencia tecnológica con respecto a estas empresas. Estamos viendo una época de disrupciones y hay temor de no quedarse atrás en este tipo de desarrollos, para no depender de tecnología importada o cajas negras de otros sitios. Un poco algo de eso se da. Y, por otro lado, el tema regulación, a nivel político, muchos piensan que eso coarta el desarrollo de tecnologías, pero sin dudas hay que hacerlo, porque la primacía es lo social. Uno quiere una tecnología que sirva al bienestar de la sociedad, y lo mismo uno quisiera en la economía. Ese tema de alineación de los valores de la IA es algo parecido sucede con la tecnología en general y no solo ahí sino en otros ámbitos. Hay una pequeña crisis que estamos viviendo hoy en día, donde muchos de los beneficios de los desarrollos tecnológicos y de la globalización no necesariamente van a los ciudadanos, y ese tipo de separación no es algo que se pueda mantener.
–¿En qué sentido? ¿A qué se refiere?
–Uno ve las compañías de delivery, por ejemplo. Es una combinación de tecnología del siglo XXI con condiciones laborales del siglo 19. ¿A quién le toca regular eso? A los estados. Ahí hay IA, desarrollo tecnológico y automatización. Esos chicos que hacen esos repartos son trabajadores que tienen que tener los beneficios que tienen los trabajadores del siglo XX y XXI. Parece increíble que uno esté hablando de este tipo de cosas, pero al final de alguna manera es pensar cómo hacer que estos desarrollos de inteligencia artificial y automatizaicón vayan en beneficio de la sociedad y no solo de unos pocos. Y el problema de cómo cuadrar eso es un tema político.
http://indecquetrabajaiii.blogspot.com.ar/. INDECQUETRABAJA
No hay comentarios.:
Publicar un comentario
Nota: sólo los miembros de este blog pueden publicar comentarios.