Los traductores: Navegando el contexto con Modelos de Lenguaje a Gran Escala

Tower of babel by bing

Durante mi vida he trabajado con diversas personas. A pesar de que solía obtener buenas notas en la escuela y la gente frecuentemente quería formar equipo conmigo, gran parte de mi periodo escolar lo llevé a cabo de manera independiente. Mi experiencia en la escuela técnica fue particularmente desafiante, ya que avanzaba por mi cuenta y muchas veces tenía que pasar noches en vela para cumplir con los plazos de entrega de las tareas.

Sin embargo, todo cambió al ingresar a la universidad. Allí hice buenos amigos y las dinámicas eran distintas. Si había algo que no comprendía, podía consultar a mis compañeros, quienes destacaban cada uno en un área específica. En la universidad, existían “roles” rotativos, y fuimos mejorando juntos, delegando tareas según quién estuviera mejor preparado para qué. Llevamos a cabo proyectos muy exitosos y nuestra sinergía mejoró con el tiempo.

Durante mi etapa universitaria, también trabajé y me di cuenta de que, en realidad, en el mundo laboral y en la vida en general, las cosas funcionan de una manera bastante diferente.

El trabajo y el contexto

Siempre que se entra a un nuevo puesto de trabajo, existen unos días o semanas de adaptación y aprendizaje, necesarios para familiarizarse con las tareas y responsabilidades que se deben asumir. En algunos lugares, este proceso es más sencillo. Por ejemplo, en las consultorías donde trabajé, por cada nuevo proyecto se generaba una gran cantidad de documentación. En startups pequeñas, la situación es diferente: a menudo hay poca documentación previa, pero dado que el contexto no es tan amplio, se puede transmitir de manera más o menos eficiente.

Ahora bien, ¿qué ocurre en las grandes empresas? ¿O en las startups que se convierten en gigantes? En estos casos, la adaptación ya no es tan sencilla. En mi experiencia particular, trabajé en una startup muy popular que creció muy rápidamente. A causa de este crecimiento veloz, gran parte de los sistemas originales no estaban bien documentados. La empresa creció, se expandió, y fue mejorando sus soluciones. Cuando me incorporé, ya había un sistema robusto en funcionamiento, creado por aquellos que luego buscaron nuevos horizontes.

Debido a la falta de documentación actualizada, tuvimos que recurrir a conversaciones, revisión de documentación antigua y a sesiones de análisis de código línea por línea. Se podría decir que tardé casi un año y medio en adquirir un entendimiento completo de cómo funcionaba cada aspecto del sistema y aun así hubieron cosas que hasta mi salida no entendía del todo, ya que el contexto no solo recidía en mi, si no en parte en mis otros compañeros y esto es importante de recordar. No puedo decir si alguno de mis compañeros logró hacerlo en menos tiempo, ya que ninguno permaneció en la empresa durante un año completo.

Como mencionamos anteriormente, adquirir el contexto completo de una empresa puede llevar bastante tiempo, especialmente si hay una alta rotación de personal. Muchas de las propuestas más innovadoras que pude aportar no hubieran sido posibles sin un entendimiento amplio del contexto. Cuando solo tienes conocimiento de una pequeña sección, puedes pasar por alto cómo esta interactúa con otros equipos o componentes. Por tanto, si uno desea proponer ideas más efectivas en el trabajo o en cualquier otra actividad, es necesario contar con personas que puedan establecer conexiones mentales entre los diferentes aspectos decisivos de su labor.

En otras palabras, si aspiras a convertirte en un experto, tendrás que dedicar mucho tiempo al estudio y la práctica. El inconveniente de esto es que cada vez que se integra alguien nuevo al equipo, esta persona tendrá que atravesar el mismo camino de aprendizaje por el que tú pasaste. ¿No sería maravilloso si pudiéramos compartir el contexto de manera más eficiente?

LLMs y el contexto

En los últimos meses, nos hemos maravillado con tecnologías como ChatGPT, las cuales nos permiten utilizar modelos de lenguaje de gran escala (LLMs) para analizar textos. Con esto, podemos resolver tareas como preguntas y respuestas (QA), síntesis, reescritura, entre muchas otras. En una publicación anterior, exploramos cómo podemos utilizar los LLMs para crear un buscador de perfumes. Pero, ¿qué sucedería si, en lugar de buscar perfumes, buscáramos un contexto? Y si el contexto que buscamos resulta difícil de comprender, ¿sería posible que un LLM nos lo explique utilizando un lenguaje más accesible, es decir, “nuestras palabras”?

Vamos a poner un ejemplo en donde le pedimos a ChatGPT que nos explique de forma “sencilla” que es la dilatación espacio-temporal.

ChatGPT: ¡Claro! ¿Sabes cuando estás esperando para hacer algo que realmente te gusta y se siente como si pasara muy lento el tiempo? Pero cuando estás haciendo lo que te gusta, el tiempo parece pasar volando. Eso es un poquito parecido a cómo funciona la dilatación del espacio-tiempo.

Imagina que el espacio y el tiempo son como una sábana elástica. Y tú estás jugando con tu pelota y la haces rodar sobre la sábana. Si la sábana está plana y no tiene nada pesado sobre ella, la pelota se moverá en línea recta y siempre tomará el mismo tiempo en llegar al otro lado. Pero si pones algo muy pesado, como un gran balón de baloncesto, la sábana se doblará porque el balón de baloncesto es pesado. ¿ ves cómo se hace como una curva o cuna? Si ahora intentas rodar la pelota, no irá en línea recta, seguirá la curva creada por el balón de baloncesto y probablemente tomará más tiempo en llegar al otro lado.
Prompt utilizado

Es interesante que nos haya hecho una explicación relativamente sencilla, así como pudo simplificar la explicación de este ejemplo podríamos utilizarlo para poder expresar mejor lo que queremos decir, entender temas que a priori pueden parecer complicados y algo aun más interesante es poder entender a otras personas.

Rompe las barrera del contexto

Vamos a hacer tangibles estas ideas. Para poder entenderlas, mostramos el siguiente diagrama en el cual podemos diferenciar tres componentes:

Diagrama general
  1. Llama Index: Esta es una interfaz que nos permite indexar información. Llama Index se apoya en los LLM para navegar por la información indexada.
  2. LLM: El LLM es la parte “lógica” que decide cómo se debe acceder a la información para lograr un objetivo. Además, el LLM transforma nuestras consultas en lenguaje natural en algo que Llama Index puede entender para navegar por nuestro “mar” de información.
  3. Información: En el diagrama, vemos que podemos indexar todo tipo de información desde varios orígenes. Por ejemplo, podemos utilizar APIs para acceder a servicios de terceros, conectar bases de datos o simplemente ingerir archivos en bruto.

¿Qué nos permite esta pequeña arquitectura? Bueno, imaginemos que tenemos muchos archivos y documentación en nuestro trabajo. Podríamos indexar toda esa información. Una vez indexada, podríamos usar un LLM para entender aspectos del negocio que desconocemos. Esto podría permitir cerrar la brecha del contexto para las personas que recién ingresan o para aquellas que, aunque llevan tiempo en la empresa, no conocen algunas áreas o proyectos.

Como dato curioso, incluso se podría usar un LLM experto en programación para que utilice un sistema base como este, a fin de obtener información y saber qué y dónde debe hacer las modificaciones pertinentes, por ejemplo, para añadir una nueva funcionalidad a un sistema ya programado, permitiendonos ser virtualmente un equipo de 100 personas siendo 1 sola persona junto con la ayuda de la inteligencia artificial.

Esto es perfectamente plausible

Rompe las barrera del lenguaje

Los LLMs han demostrado una gran capacidad para comprender diferentes idiomas, lo que les permite participar en la creación de sistemas de traducción avanzados. La importancia del contexto en la traducción es innegable, especialmente al tratar con textos complejos, como los filosóficos, donde la interpretación y el análisis son cruciales. En tales casos, los términos mal traducidos pueden alterar completamente el significado y la intención del autor original.

Aunque la adición de contexto en los procesos de traducción puede ayudar a mejorar la automatización y la precisión en la traducción de libros, artículos científicos, novelas y más, debemos reconocer que los LLMs no son la solución definitiva para los desafíos de traducción. Específicamente en el campo de la filosofía, los textos se basan en contextos culturales, históricos y personales tan intrincados que aún requieren la interpretación y el juicio humanos para una traducción precisa y significativa.

Por lo tanto, aunque los LLMs pueden proporcionar asistencia valiosa en la identificación de traducciones o interpretaciones posibles, la intervención humana seguirá siendo indispensable, especialmente cuando se trata de textos que requieren un profundo conocimiento de los contextos culturales e históricos o un entendimiento de teorías filosóficas específicas, pero ahí es donde estas herramientas potenciaran nuestra capacidad de entender estos textos que muchas veces fueron escritos deliveradamente complejos para su dificil comprensión.

Rompe todo lo demás

El tema central de este artículo es el contexto y cómo tecnologías como los Modelos de Lenguaje a Gran Escala (LLM) pueden ayudarnos a comprender mejor el mundo que nos rodea. En la actualidad, vivimos en burbujas ideológicas, muchas veces sin siquiera notarlo. Nuestro lenguaje lleva consigo creencias y estas creencias pueden constituir barreras que nos dificultan entender otros idiomas, culturas o personas.

En los últimos meses, he explorado varios textos filosóficos. Intentar entender la filosofía es más complicado de lo que parece. Incluso las ideas orientales, que a menudo son rechazadas en Occidente, tienen perspectivas valiosas que ofrecer. Durante mucho tiempo, reemplacé la fe en “Dios” con la fe en la ciencia, sin darme cuenta de que este movimiento me estaba colocando en un nuevo conjunto de dogmas. Estos dogmas pueden, de hecho, obstaculizar el trabajo de la ciencia misma.

Translate ideas

Por lo tanto, la propuesta ambiciosa sería utilizar estas tecnologías no simplemente para “traducir” de “X” a “Y”, sino para ayudarnos a comprender y establecer puentes entre nuestras ideas. A menudo olvidamos que todos estamos en la misma búsqueda, todos estamos tratando de vivir y comprender la vida. Cada palabra que escribimos, cada texto que leemos, cada acción que realizamos, todo está imbuido de nuestra humanidad y contribuye a nuestro crecimiento.

Conclusión

En esencia, los LLMs y tecnologías similares son más que simples herramientas de traducción. Estos avances nos dan la capacidad de abrir los ojos ante propuestas alternativas y a conectar caminos que de otra manera permanecerían distantes. Nos permiten entender el lenguaje que va más allá de las palabras y llegar al corazón de las ideas, traduciendo no solo frases, sino contextos, conceptos e ideologías. Sí, aún queda un largo camino por recorrer y los humanos necesitamos estar al mando para mantener el contexto y la profundidad requeridos en ciertos escenarios. Sin embargo, al soñar con una nueva y mejor Torre de Babel, no estamos pensando solo en hablar los unos con los otros. Soñamos con entender nuestras diferencias y con apreciar las otras burbujas de pensamiento que coexisten en nuestro mundo. ¿Quién sabe? Quizás, en la intersección de nuestra humanidad y la tecnología, esté el verdadero contexto de entender nuestra existencia.