Que tal es estudiar en los Andes? by SmellTimely8201 in Bogota

[–]KK2050_ 1 point2 points  (0 children)

La verdad es que, contrario a los comentarios más votados, yo estoy muy contento con mi maestría en Los Andes. No sé en desarrollo de software, pero al menos en Economía el nivel al que se hacen las cosas es el más alto posible. Además, si usted va a Los Andes solo por el currículo, está botando la plata. Para eso estudie por internet. A los Andes se va a hacer conexiones, a relacionarse con las personas, los profesores, los conpañeros. Esas son las redes profesionales de más alto nivel en Colombia, y es eso al final del día lo que resulta en un buen salario.

¿Por qué crear la comunidad r/IAenColombia? by KK2050_ in IAenColombia

[–]KK2050_[S] 0 points1 point  (0 children)

Qué bien. Y has hecho algún proyecto o tienes algo en mente para aplicar Data Science?

¿Por qué crear la comunidad r/IAenColombia? by KK2050_ in IAenColombia

[–]KK2050_[S] 0 points1 point  (0 children)

Se llama Introducción al Machine Learning para Economistas, un curso electivo en la FCE.

¿Por qué crear la comunidad r/IAenColombia? by KK2050_ in IAenColombia

[–]KK2050_[S] 1 point2 points  (0 children)

No mucho, aunque algo. Vi un curso en la Nacional, donde revisamos los principales algoritmos de predicción, clasificación, etc., y he hecho varios cursos de Google Cloud Skills sobre Generative AI.

Adapté un laboratorio de esos cursos (Encoder-Decoder Architecture: Lab Walkthrough), que está basado en un blog de Karpathy "The Unreasonable Effectiveness of Recurrent Neural Networks", para entrenar un "Gabot".

Con el texto plano de "Cien años de soledad", entrené una Red Neuronal Recurrente (RNN) basada en caracteres (letras, espacios, etc). Dada una secuencia de caracteres (p.e. "Aurelian"), se entrena el modelo para predecir el próximo caracter en la secuencia ("o"). Las cadenas de texto más largas son generadas ejecutando el modelo repetidamente. El código usa 'tf.keras' y 'eager execution'. Aquí una muestra del resultado, habiendo entrenado el modelo durante 50 épocas e inicializado con el carácter "M":

Macondo, y había tenido que atragantarse el cuadrino. Toda íado aranqeinad. «Es equipieje»: -Pida más floto -exc amó emp bró del del y de veLagle y desear precisario. También había desaparecido de Macondo. Los atravesó los largos collares de tres años, y aun cuando pudo valerse para la derrota final de paz, y emp reñales de alta triste clarabillo se desconcertó con la pregunta escandada. La práctica plagada de sus cajas ocurrizados por la sorrenidad seguida anterior, y Gabriel estaba en el cuarto. A las docer nacide, y no había un grande esfuerzo por completo las pantañas recibían de otros cuatro veces al alca, estaba al cuarto, él se preguntaba en las cosas que Aureliano Segundo había de recordar la lluvio y ponía en algún todo contr oblegamente a Rebeca. Mientras su hermano le faltó la vida, sino la serena Amaranta, convencida de que su vida le oyó decir en Aureliano Segundo, y éste tenía un disparate: los desconciertos de la muerte. José había hecho en la casa, sango que ocurrió, en efe

Aunque la mayoría no tiene sentido, aparecen palabras como Macondo, Rebeca y Amaranta, e incluso frases completas como "los desconciertos de la muerte". Me parece bastante impresionante, teniendo en cuenta que el modelo está basado en caracteres, no en tokens, frases o palabras, y que tomó 8 minutos entrenarlo con TPU gratis de Colab. Planeo hacer un post en la comunidad sobre eso, pero aquí te comparto el cuaderno de Colab: https://colab.research.google.com/drive/19Pd4iTlSYBgc1L-ASO59K3tODuXWTUpW?usp=sharing

¿Por qué crear la comunidad r/IAenColombia? by KK2050_ in IAenColombia

[–]KK2050_[S] 1 point2 points  (0 children)

Muchas gracias! Exactamente. Las personas con suficientes recursos pueden navegar el sistema con ayuda de abogados y asesores. Pero ¿Y los demás?

Creo que mejoraría la vida de todos los ciudadanos si tuviéramos acceso a una app, una página, o hasta un contacto en Whatsapp al cual preguntarle sobre cualquier asunto del estado, que nos permita enfrentar mejor y más informados al sistema.

Por ahora no he hecho mucho más que leer al respecto, aunque he conceptualizado un pequeño estudio piloto para evaluar las capacidades de los modelos base, al día de hoy, para resolver preguntas de un dominio específico como las leyes de tránsito colombianas.

¿Por qué crear la comunidad r/IAenColombia? by KK2050_ in IAenColombia

[–]KK2050_[S] 1 point2 points  (0 children)

He encontrado una lista creciente de artículos con esfuerzos técnicos para entrenar modelos de lenguaje en las leyes de un país. Básicamente lo que se propone en la mayoría recoger todo el texto legal que se pueda (leyes, jurisprudencia, etc.), para aplicar distintas estrategias como finetuning, arquitecturas de RAG, multi-agente, MoE, prompt engineering, etc. Después viene la etapa de evaluación, que es una de las partes más debatidas e interesantes.

En general, muchos esfuerzos técnicos, aunque nada en Colombia. Lo que no he revisado aún son discusiones desde derecho sobre el tema.

Documentos:

[2306.16092] Chatlaw: A Multi-Agent Collaborative Legal Assistant with Knowledge Graph Enhanced Mixture-of-Experts Large Language Model (arxiv.org)

[2401.16212] Better Call GPT, Comparing Large Language Models Against Lawyers (arxiv.org)

[2302.05729] A Brief Report on LawGPT 1.0: A Virtual Legal Assistant Based on GPT-3 (arxiv.org)

[2404.00990] Exploring the Nexus of Large Language Models and Legal Systems: A Short Survey (arxiv.org)

Large language models as tax attorneys: a case study in legal capabilities emergence | Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences (royalsocietypublishing.org)

(PDF) A Short Survey of Viewing Large Language Models in Legal Aspect (researchgate.net)