diff --git a/docs/index.md b/docs/index.md index 01bf865..fba40a6 100644 --- a/docs/index.md +++ b/docs/index.md @@ -40,7 +40,6 @@ The Representations for Learning and Language (ReLeLa) research group located wi 2. Juan-Pablo Silva 3. Jorge Ortiz 4. Bastián Matamala -5. [Gabriel Iturra-Bocaz](https://giturra.cl/) 6. Mauricio Araneda 8. Gabriel Chaperón 9. Ignacio Meza @@ -62,6 +61,7 @@ The Representations for Learning and Language (ReLeLa) research group located wi ### Alumni +5. [Gabriel Iturra-Bocaz](https://giturra.cl/) 1. [José Cañete](https://josecannete.github.io/) 1. Juglar Díaz 2. Hernán Sarmiento diff --git a/index.html b/index.html index c44d718..58a50cc 100644 --- a/index.html +++ b/index.html @@ -195,7 +195,6 @@

Masters Students

  • Juan-Pablo Silva
  • Jorge Ortiz
  • Bastián Matamala
  • -
  • Gabriel Iturra-Bocaz
  • Mauricio Araneda
  • Gabriel Chaperón
  • Ignacio Meza
  • @@ -217,6 +216,7 @@

    Undergrad Students

    Alumni

      +
    1. Gabriel Iturra-Bocaz
    2. José Cañete
    3. Juglar Díaz
    4. Hernán Sarmiento
    5. diff --git a/search/search_index.json b/search/search_index.json index a22153d..f8b0f67 100644 --- a/search/search_index.json +++ b/search/search_index.json @@ -1 +1 @@ -{"config":{"indexing":"full","lang":["en"],"min_search_length":3,"prebuild_index":false,"separator":"[\\s\\-]+"},"docs":[{"location":"","text":"The Representations for Learning and Language (ReLeLa) research group located within the Department of Computer Science (DCC) at the University of Chile studies the fields of representation learning and natural language processing, as well as other topics related to data science and artificial intelligence. Members Academic Staff Andr\u00e9s Abeliuk Ricardo Baeza-Yates Felipe Bravo-Marquez Benjam\u00edn Bustos Jocelyn Dunstan Eduardo Graells-Garrido Claudio Guti\u00e9rrez Aidan Hogan Jorge P\u00e9rez B\u00e1rbara Poblete Iv\u00e1n Sipir\u00e1n Jorge Silva Students PhD Students Aym\u00e9 Arango Rolando Kindelan Jesus Perez-Martin Frank Zamora Cinthia S\u00e1nchez Fabi\u00e1n Villena Masters Students Daniel Aguirre Juan-Pablo Silva Jorge Ortiz Basti\u00e1n Matamala Gabriel Iturra-Bocaz Mauricio Araneda Gabriel Chaper\u00f3n Ignacio Meza Mar\u00eda Jos\u00e9 Zambrano Humberto Rodrigues David Rojas Ignacio N\u00fa\u00f1ez Sebasti\u00e1n Tinoco Felipe Urrutia Victor Faraggi Undergrad Students Monserrat Prado Juan Andr\u00e9s Moreno Sebasti\u00e1n Donoso Maximiliano Aguilar Rodrigo Urrea Alumni Jos\u00e9 Ca\u00f1ete Juglar D\u00edaz Hern\u00e1n Sarmiento Mat\u00edas Rojas Cristi\u00e1n Ahumada Constanza Fierro Daniel Diomedi Pablo Badilla Cristi\u00e1n Tamblay Henry Rosales Camilo Garrido Vicente Oyanedel Ricardo C\u00f3rdova Collaborators Mircea Petrache Valentin Barriere Cristian Rodriguez Edison Marrese-Taylor Mauricio Quezada Felipe Tobar Jos\u00e9 Manuel Saavedra Juan Manuel Barrios Mauricio Cerda Alexandre Bergel Projects Spanish Word Embeddings AffectiveTweets BETO: Spanish BERT WEFE: The Word Embeddings Fairness Evaluation Framework ALBETO and DistilBETO: Lightweight Spanish Language Models RiverText: An Python Library for Training and Evaluating Incremental Word Embeddings Courses Deep Learning Natural Language Processing Data Mining Statistical Thinking Network Members of our group participate or interact with the following other research groups, centers or companies: National Center for Artificial Intelligence Research (CENIA) Millennium Institute for Foundational Research on Data CERO.AI Natural Language Processing @ CMM The Laboratory of Scientific Image Analysis (SCIAN-Lab) Grupo de Aprendizaje de M\u00e1quinas, infErencia y Se\u00f1ales (GAMES) Machine Learning Group - University of Waikato Impresee eCommerce Labs","title":"Home"},{"location":"#members","text":"","title":"Members"},{"location":"#academic-staff","text":"Andr\u00e9s Abeliuk Ricardo Baeza-Yates Felipe Bravo-Marquez Benjam\u00edn Bustos Jocelyn Dunstan Eduardo Graells-Garrido Claudio Guti\u00e9rrez Aidan Hogan Jorge P\u00e9rez B\u00e1rbara Poblete Iv\u00e1n Sipir\u00e1n Jorge Silva","title":"Academic Staff"},{"location":"#students","text":"","title":"Students"},{"location":"#phd-students","text":"Aym\u00e9 Arango Rolando Kindelan Jesus Perez-Martin Frank Zamora Cinthia S\u00e1nchez Fabi\u00e1n Villena","title":"PhD Students"},{"location":"#masters-students","text":"Daniel Aguirre Juan-Pablo Silva Jorge Ortiz Basti\u00e1n Matamala Gabriel Iturra-Bocaz Mauricio Araneda Gabriel Chaper\u00f3n Ignacio Meza Mar\u00eda Jos\u00e9 Zambrano Humberto Rodrigues David Rojas Ignacio N\u00fa\u00f1ez Sebasti\u00e1n Tinoco Felipe Urrutia Victor Faraggi","title":"Masters Students"},{"location":"#undergrad-students","text":"Monserrat Prado Juan Andr\u00e9s Moreno Sebasti\u00e1n Donoso Maximiliano Aguilar Rodrigo Urrea","title":"Undergrad Students"},{"location":"#alumni","text":"Jos\u00e9 Ca\u00f1ete Juglar D\u00edaz Hern\u00e1n Sarmiento Mat\u00edas Rojas Cristi\u00e1n Ahumada Constanza Fierro Daniel Diomedi Pablo Badilla Cristi\u00e1n Tamblay Henry Rosales Camilo Garrido Vicente Oyanedel Ricardo C\u00f3rdova","title":"Alumni"},{"location":"#collaborators","text":"Mircea Petrache Valentin Barriere Cristian Rodriguez Edison Marrese-Taylor Mauricio Quezada Felipe Tobar Jos\u00e9 Manuel Saavedra Juan Manuel Barrios Mauricio Cerda Alexandre Bergel","title":"Collaborators"},{"location":"#projects","text":"Spanish Word Embeddings AffectiveTweets BETO: Spanish BERT WEFE: The Word Embeddings Fairness Evaluation Framework ALBETO and DistilBETO: Lightweight Spanish Language Models RiverText: An Python Library for Training and Evaluating Incremental Word Embeddings","title":"Projects"},{"location":"#courses","text":"Deep Learning Natural Language Processing Data Mining Statistical Thinking","title":"Courses"},{"location":"#network","text":"Members of our group participate or interact with the following other research groups, centers or companies: National Center for Artificial Intelligence Research (CENIA) Millennium Institute for Foundational Research on Data CERO.AI Natural Language Processing @ CMM The Laboratory of Scientific Image Analysis (SCIAN-Lab) Grupo de Aprendizaje de M\u00e1quinas, infErencia y Se\u00f1ales (GAMES) Machine Learning Group - University of Waikato Impresee eCommerce Labs","title":"Network"},{"location":"ciclos/","text":"Ciclos de Charlas ReLeLa Las (im)posibilidades de los Modelos del Lenguaje Lugar: Auditorio Ram\u00f3n Picarte, DCC UCHILE. Direcci\u00f3n: Avenida Beauchef 851, Tercer Piso, Edificio Norte, Santiago. Organizaci\u00f3n: RELELA , DCC Uchile . Patrocinadores: CENIA , IMFD . Ser\u00e1 en formato h\u00edbrido y se transmitir\u00e1 a trav\u00e9s del canal de Youtube del DCC . Inscripciones Sobre el evento La creciente importancia y la masividad que han adquirido recientemente los modelos de lenguaje como ChatGPT ha generado en la ciudadan\u00eda preocupaciones sobre sus condiciones de posibilidad y sus limitaciones. Debido a la naturaleza multidisciplinaria de la problem\u00e1tica, se requiere crear espacios de di\u00e1logo, difusi\u00f3n y la colaboraci\u00f3n entre expertos de diferentes \u00e1reas. El objetivo de este ciclo es brindar una visi\u00f3n amplia y cr\u00edtica sobre el desarrollo y las posibilidades de los modelos de lenguaje, espec\u00edficamente en relaci\u00f3n a los \u00faltimos avances tecnol\u00f3gicos en el campo de la inteligencia artificial. Se busca explicar los fundamentos t\u00e9cnicos de estas tecnolog\u00edas y fomentar la reflexi\u00f3n y el debate sobre el papel que juegan estos modelos en la sociedad actual, sus limitaciones y posibles riesgos, y las implicaciones \u00e9ticas y sociales que plantean. Cronograma Mi\u00e9rcoles 3 de mayo 4PM Presentador: Presentador: Jorge Ortiz DCC Uchile, IMFD, Awto. T\u00edtulo: \u00bfPuede ChatGPT conquistar el mundo? Lenguaje humano vs lenguaje de m\u00e1quina ( slides , grabaci\u00f3n ). Mi\u00e9rcoles 10 de mayo 4PM Presentador: Felipe Bravo-M\u00e1rquez DCC Uchile, IMFD, CENIA. T\u00edtulo: Un recorrido por los Modelos de Lenguaje: desde Shannon a GPT-4 ( slides , grabaci\u00f3n ). Mi\u00e9rcoles 17 de mayo 4PM Presentadora: Gabriela Arriagada, IEA, IMC, UC, CENIA. T\u00edtulo: Desaf\u00edos \u00e9ticos actuales a la luz de la revoluci\u00f3n sociotecnol\u00f3gica del GPT3 y 4 ( slides , grabaci\u00f3n ). Mi\u00e9rcoles 24 de mayo 4PM T\u00edtulo: ChatGPT en la Industria: posibilidades y proyecciones , ( grabaci\u00f3n ). Charla 1: \"IA sin far\u00e1ndula\" por Jorge P\u00e9rez (CERO) ( slides ). Charla 2: \"GPT y Agentes, Como Conversar con tu App\" por Manuel Pe\u00f1a (Fintual) ( slides ). Mi\u00e9rcoles 31 de mayo 4PM T\u00edtulo: Panel de Discusi\u00f3n - Alcances y l\u00edmites de los modelos de lenguaje ( grabaci\u00f3n ). Panelistas: Cristi\u00e1n Buc (CENIA), Magdalena Salda\u00f1a (UC/IMFD), Mart\u00edn C\u00e1ceres (MINEDUC) y Felipe Tobar (IDIA Uchile, CMM). slides mini-presentaci\u00f3n de Cristi\u00e1n Buc. Moderador: Claudio Guti\u00e9rrez (DCC Uchile, IMFD). Expositores Felipe Bravo-M\u00e1rquez Profesor asistente en el Departamento de Ciencias de la Computaci\u00f3n de la Universidad de Chile, Investigador Asociado del Centro Nacional de Inteligencia Artificial (CENIA) e Investigador Joven del Instituto Milenio Fundamento de los Datos (IMFD). Realiz\u00f3 su doctorado en el grupo Machine Learning de la Universidad de Waikato, Nueva Zelanda, donde tambi\u00e9n trabaj\u00f3 como Research Fellow durante dos a\u00f1os. Sus intereses de investigaci\u00f3n abarcan las \u00e1reas del procesamiento del lenguaje natural (NLP), el aprendizaje autom\u00e1tico (ML), la inteligencia artificial (AI) y la recuperaci\u00f3n de informaci\u00f3n (IR). Jorge Ortiz Fuentes Data Scientist y Ling\u00fcista. Licenciado en Letras Hisp\u00e1nicas de la Pontificia Universidad Cat\u00f3lica, Mag\u00edster (c) en Ciencias de la Computaci\u00f3n de la Universidad de Chile y Estudiante IMFD . Sus \u00e1reas de investigaci\u00f3n y desarrollo abarcan el procesamiento de Lenguaje Natural, la Ciencia de Datos y la Ling\u00fc\u00edstica. Actualmente se desempe\u00f1a como Machine Learning Engineer en Awto. Gabriela Arriagada Profesora Asistente, Instituto de \u00c9tica Aplicada (IEA) & Instituto de Ingenier\u00eda Matem\u00e1tica y Computacional (IMC), UC, Investigadora CENIA. Candidata a Doctor en Filosof\u00eda y \u00c9tica Aplicada de la Universidad de Leeds, Inglaterra . La mayor parte de su trabajo se centra en la \u00e9tica aplicada. Actualmente investiga sobre sesgo, equidad y explicabilidad en IA y ciencia de datos. Jorge Per\u00e9z Co-Fundador de Cero.ai. Cero.ai es una empresa que apoya a que los pacientes lleguen a sus citas a la hora y preparados. Actualmente dirige el desarrollo en inteligencia artificial del producto, y est\u00e1 a cargo de las ventas a instituciones p\u00fablicas de salud. Antes de cero.ai fue acad\u00e9mico e investigador universitario por m\u00e1s de 15 a\u00f1os (DCC Uchile) y estudi\u00f3 un PhD en Computaci\u00f3n (UC). Su \u00e1rea principal de investigaci\u00f3n es el Procesamiento de Lenguaje Natural y Redes Neuronales Profundas. Jos\u00e9 Manuel Pe\u00f1a Senior Portfolio Manager en Fintual, Ingeniero Civil Industrial de la Universidad de Chile, Chartered Financial Analyst (CFA) y Master en Applied Analytics de la Universidad de Columbia en Nueva York . Ha ejercido cargos en la industria financiera en \u00e1reas de an\u00e1lisis, desarrollo y gesti\u00f3n de portafolios para clientes privados y fondos de pensiones, adem\u00e1s de haber realizado emprendimientos en \u00e1reas de analytics e inteligencia artificial. Manu tambi\u00e9n es Regional Chair del Columbia SPS Career Coalition y miembro de la comisi\u00f3n de Inteligencia Artificial y Big Data del Instituto de Ingenieros de Chile. Cristi\u00e1n Buc Investigador CENIA: Jefe del grupo cient\u00edfico @ CENIA. PhD en Neurociencias Computacionales Cognitivas de la Universidad Libre de Bruselas, postdoctorados en Ghent University y Brown University . Su \u00e1rea de investigaci\u00f3n emerge de la intersecci\u00f3n entre Neurociencias e IA. En particular, su trabajo se centra en el desarrollo de redes neuronales inspiradas en funciones y mecanismos cerebrales. Magdalena Salda\u00f1a Profesora Asistente de la Facultad de Comunicaciones de la Pontificia Universidad Cat\u00f3lica de Chile e investigadora del Instituto Milenio Fundamento de los Datos. Doctora en Periodismo y Comunicaci\u00f3n de Masas, University of Texas- Austin (Estados Unidos). Mag\u00edster en Investigaci\u00f3n Social y Desarrollo, Universidad de Concepci\u00f3n. Periodista, Universidad de Concepci\u00f3n. Sus \u00e1reas de investigaci\u00f3n son: Medios digitales, comunicaci\u00f3n pol\u00edtica, opini\u00f3n p\u00fablica y estudios latinoamericanos. Felipe Tobar Profesor Asociado, Universidad de Chile, Director, Iniciativa de Datos e Inteligencia Artificial, Uchile, Investigador, CMM & AC3E. Su investigaci\u00f3n se sit\u00faa entre el Aprendizaje Autom\u00e1tico Estad\u00edstico y el Procesamiento de Se\u00f1ales, incluyendo inferencia aproximada, inferencia no-param\u00e9trica bayesiana, estimaci\u00f3n espectral y transporte \u00f3ptimo computacional. Mart\u00edn C\u00e1ceres Director del Centro de Innovaci\u00f3n MINEDUC. Licenciado en F\u00edsica y Doctor en Ciencias de la Ingenier\u00eda de la Pontificia Universidad Cat\u00f3lica de Chile. Ha trabajado como docente en el sistema escolar ense\u00f1ando f\u00edsica, electr\u00f3nica y rob\u00f3tica, y en el sistema universitario ha dictado cursos de humanidades digitales y metodolog\u00edas innovadoras de ense\u00f1anza y aprendizaje. Adem\u00e1s, ha trabajado en asesor\u00edas a escuelas y universidades y en pol\u00edtica p\u00fablica relacionada con innovaci\u00f3n pedag\u00f3gica en Chile y en el extranjero. Afiches \u00bfPuede ChatGPT conquistar el mundo? Lenguaje humano vs lenguaje de m\u00e1quina. Un recorrido por los Modelos de Lenguaje: desde Shannon a GPT-4. Desaf\u00edos \u00e9ticos actuales a la luz de la revoluci\u00f3n sociotecnol\u00f3gica del GPT3 y 4. ChatGPT en la Industria: posibilidades y proyecciones. Alcances y l\u00edmites de los modelos de lenguaje.","title":"Ciclos de Charlas"},{"location":"ciclos/#ciclos-de-charlas-relela","text":"","title":"Ciclos de Charlas ReLeLa"},{"location":"ciclos/#las-imposibilidades-de-los-modelos-del-lenguaje","text":"Lugar: Auditorio Ram\u00f3n Picarte, DCC UCHILE. Direcci\u00f3n: Avenida Beauchef 851, Tercer Piso, Edificio Norte, Santiago. Organizaci\u00f3n: RELELA , DCC Uchile . Patrocinadores: CENIA , IMFD . Ser\u00e1 en formato h\u00edbrido y se transmitir\u00e1 a trav\u00e9s del canal de Youtube del DCC .","title":"Las (im)posibilidades de los Modelos del Lenguaje"},{"location":"ciclos/#inscripciones","text":"","title":"Inscripciones"},{"location":"ciclos/#sobre-el-evento","text":"La creciente importancia y la masividad que han adquirido recientemente los modelos de lenguaje como ChatGPT ha generado en la ciudadan\u00eda preocupaciones sobre sus condiciones de posibilidad y sus limitaciones. Debido a la naturaleza multidisciplinaria de la problem\u00e1tica, se requiere crear espacios de di\u00e1logo, difusi\u00f3n y la colaboraci\u00f3n entre expertos de diferentes \u00e1reas. El objetivo de este ciclo es brindar una visi\u00f3n amplia y cr\u00edtica sobre el desarrollo y las posibilidades de los modelos de lenguaje, espec\u00edficamente en relaci\u00f3n a los \u00faltimos avances tecnol\u00f3gicos en el campo de la inteligencia artificial. Se busca explicar los fundamentos t\u00e9cnicos de estas tecnolog\u00edas y fomentar la reflexi\u00f3n y el debate sobre el papel que juegan estos modelos en la sociedad actual, sus limitaciones y posibles riesgos, y las implicaciones \u00e9ticas y sociales que plantean.","title":"Sobre el evento"},{"location":"ciclos/#cronograma","text":"Mi\u00e9rcoles 3 de mayo 4PM Presentador: Presentador: Jorge Ortiz DCC Uchile, IMFD, Awto. T\u00edtulo: \u00bfPuede ChatGPT conquistar el mundo? Lenguaje humano vs lenguaje de m\u00e1quina ( slides , grabaci\u00f3n ). Mi\u00e9rcoles 10 de mayo 4PM Presentador: Felipe Bravo-M\u00e1rquez DCC Uchile, IMFD, CENIA. T\u00edtulo: Un recorrido por los Modelos de Lenguaje: desde Shannon a GPT-4 ( slides , grabaci\u00f3n ). Mi\u00e9rcoles 17 de mayo 4PM Presentadora: Gabriela Arriagada, IEA, IMC, UC, CENIA. T\u00edtulo: Desaf\u00edos \u00e9ticos actuales a la luz de la revoluci\u00f3n sociotecnol\u00f3gica del GPT3 y 4 ( slides , grabaci\u00f3n ). Mi\u00e9rcoles 24 de mayo 4PM T\u00edtulo: ChatGPT en la Industria: posibilidades y proyecciones , ( grabaci\u00f3n ). Charla 1: \"IA sin far\u00e1ndula\" por Jorge P\u00e9rez (CERO) ( slides ). Charla 2: \"GPT y Agentes, Como Conversar con tu App\" por Manuel Pe\u00f1a (Fintual) ( slides ). Mi\u00e9rcoles 31 de mayo 4PM T\u00edtulo: Panel de Discusi\u00f3n - Alcances y l\u00edmites de los modelos de lenguaje ( grabaci\u00f3n ). Panelistas: Cristi\u00e1n Buc (CENIA), Magdalena Salda\u00f1a (UC/IMFD), Mart\u00edn C\u00e1ceres (MINEDUC) y Felipe Tobar (IDIA Uchile, CMM). slides mini-presentaci\u00f3n de Cristi\u00e1n Buc. Moderador: Claudio Guti\u00e9rrez (DCC Uchile, IMFD).","title":"Cronograma"},{"location":"ciclos/#expositores","text":"","title":"Expositores"},{"location":"ciclos/#felipe-bravo-marquez","text":"Profesor asistente en el Departamento de Ciencias de la Computaci\u00f3n de la Universidad de Chile, Investigador Asociado del Centro Nacional de Inteligencia Artificial (CENIA) e Investigador Joven del Instituto Milenio Fundamento de los Datos (IMFD). Realiz\u00f3 su doctorado en el grupo Machine Learning de la Universidad de Waikato, Nueva Zelanda, donde tambi\u00e9n trabaj\u00f3 como Research Fellow durante dos a\u00f1os. Sus intereses de investigaci\u00f3n abarcan las \u00e1reas del procesamiento del lenguaje natural (NLP), el aprendizaje autom\u00e1tico (ML), la inteligencia artificial (AI) y la recuperaci\u00f3n de informaci\u00f3n (IR).","title":"Felipe Bravo-M\u00e1rquez"},{"location":"ciclos/#jorge-ortiz-fuentes","text":"Data Scientist y Ling\u00fcista. Licenciado en Letras Hisp\u00e1nicas de la Pontificia Universidad Cat\u00f3lica, Mag\u00edster (c) en Ciencias de la Computaci\u00f3n de la Universidad de Chile y Estudiante IMFD . Sus \u00e1reas de investigaci\u00f3n y desarrollo abarcan el procesamiento de Lenguaje Natural, la Ciencia de Datos y la Ling\u00fc\u00edstica. Actualmente se desempe\u00f1a como Machine Learning Engineer en Awto.","title":"Jorge Ortiz Fuentes"},{"location":"ciclos/#gabriela-arriagada","text":"Profesora Asistente, Instituto de \u00c9tica Aplicada (IEA) & Instituto de Ingenier\u00eda Matem\u00e1tica y Computacional (IMC), UC, Investigadora CENIA. Candidata a Doctor en Filosof\u00eda y \u00c9tica Aplicada de la Universidad de Leeds, Inglaterra . La mayor parte de su trabajo se centra en la \u00e9tica aplicada. Actualmente investiga sobre sesgo, equidad y explicabilidad en IA y ciencia de datos.","title":"Gabriela Arriagada"},{"location":"ciclos/#jorge-perez","text":"Co-Fundador de Cero.ai. Cero.ai es una empresa que apoya a que los pacientes lleguen a sus citas a la hora y preparados. Actualmente dirige el desarrollo en inteligencia artificial del producto, y est\u00e1 a cargo de las ventas a instituciones p\u00fablicas de salud. Antes de cero.ai fue acad\u00e9mico e investigador universitario por m\u00e1s de 15 a\u00f1os (DCC Uchile) y estudi\u00f3 un PhD en Computaci\u00f3n (UC). Su \u00e1rea principal de investigaci\u00f3n es el Procesamiento de Lenguaje Natural y Redes Neuronales Profundas.","title":"Jorge Per\u00e9z"},{"location":"ciclos/#jose-manuel-pena","text":"Senior Portfolio Manager en Fintual, Ingeniero Civil Industrial de la Universidad de Chile, Chartered Financial Analyst (CFA) y Master en Applied Analytics de la Universidad de Columbia en Nueva York . Ha ejercido cargos en la industria financiera en \u00e1reas de an\u00e1lisis, desarrollo y gesti\u00f3n de portafolios para clientes privados y fondos de pensiones, adem\u00e1s de haber realizado emprendimientos en \u00e1reas de analytics e inteligencia artificial. Manu tambi\u00e9n es Regional Chair del Columbia SPS Career Coalition y miembro de la comisi\u00f3n de Inteligencia Artificial y Big Data del Instituto de Ingenieros de Chile.","title":"Jos\u00e9 Manuel Pe\u00f1a"},{"location":"ciclos/#cristian-buc","text":"Investigador CENIA: Jefe del grupo cient\u00edfico @ CENIA. PhD en Neurociencias Computacionales Cognitivas de la Universidad Libre de Bruselas, postdoctorados en Ghent University y Brown University . Su \u00e1rea de investigaci\u00f3n emerge de la intersecci\u00f3n entre Neurociencias e IA. En particular, su trabajo se centra en el desarrollo de redes neuronales inspiradas en funciones y mecanismos cerebrales.","title":"Cristi\u00e1n Buc"},{"location":"ciclos/#magdalena-saldana","text":"Profesora Asistente de la Facultad de Comunicaciones de la Pontificia Universidad Cat\u00f3lica de Chile e investigadora del Instituto Milenio Fundamento de los Datos. Doctora en Periodismo y Comunicaci\u00f3n de Masas, University of Texas- Austin (Estados Unidos). Mag\u00edster en Investigaci\u00f3n Social y Desarrollo, Universidad de Concepci\u00f3n. Periodista, Universidad de Concepci\u00f3n. Sus \u00e1reas de investigaci\u00f3n son: Medios digitales, comunicaci\u00f3n pol\u00edtica, opini\u00f3n p\u00fablica y estudios latinoamericanos.","title":"Magdalena Salda\u00f1a"},{"location":"ciclos/#felipe-tobar","text":"Profesor Asociado, Universidad de Chile, Director, Iniciativa de Datos e Inteligencia Artificial, Uchile, Investigador, CMM & AC3E. Su investigaci\u00f3n se sit\u00faa entre el Aprendizaje Autom\u00e1tico Estad\u00edstico y el Procesamiento de Se\u00f1ales, incluyendo inferencia aproximada, inferencia no-param\u00e9trica bayesiana, estimaci\u00f3n espectral y transporte \u00f3ptimo computacional.","title":"Felipe Tobar"},{"location":"ciclos/#martin-caceres","text":"Director del Centro de Innovaci\u00f3n MINEDUC. Licenciado en F\u00edsica y Doctor en Ciencias de la Ingenier\u00eda de la Pontificia Universidad Cat\u00f3lica de Chile. Ha trabajado como docente en el sistema escolar ense\u00f1ando f\u00edsica, electr\u00f3nica y rob\u00f3tica, y en el sistema universitario ha dictado cursos de humanidades digitales y metodolog\u00edas innovadoras de ense\u00f1anza y aprendizaje. Adem\u00e1s, ha trabajado en asesor\u00edas a escuelas y universidades y en pol\u00edtica p\u00fablica relacionada con innovaci\u00f3n pedag\u00f3gica en Chile y en el extranjero.","title":"Mart\u00edn C\u00e1ceres"},{"location":"ciclos/#afiches","text":"","title":"Afiches"},{"location":"ciclos/#puede-chatgpt-conquistar-el-mundo-lenguaje-humano-vs-lenguaje-de-maquina","text":"","title":"\u00bfPuede ChatGPT conquistar el mundo? Lenguaje humano vs lenguaje de m\u00e1quina."},{"location":"ciclos/#un-recorrido-por-los-modelos-de-lenguaje-desde-shannon-a-gpt-4","text":"","title":"Un recorrido por los Modelos de Lenguaje: desde Shannon a GPT-4."},{"location":"ciclos/#desafios-eticos-actuales-a-la-luz-de-la-revolucion-sociotecnologica-del-gpt3-y-4","text":"","title":"Desaf\u00edos \u00e9ticos actuales a la luz de la revoluci\u00f3n sociotecnol\u00f3gica del GPT3 y 4."},{"location":"ciclos/#chatgpt-en-la-industria-posibilidades-y-proyecciones","text":"","title":"ChatGPT en la Industria: posibilidades y proyecciones."},{"location":"ciclos/#alcances-y-limites-de-los-modelos-de-lenguaje","text":"","title":"Alcances y l\u00edmites de los modelos de lenguaje."},{"location":"publications/","text":"2023 M. Araneda, F. Bravo-Marquez, D. Parra, and R.F C\u00e1diz MUSIB: Musical Score Inpainting Benchmark . In EURASIP Journal on Audio, Speech, and Music Processing, 2023, 19 (2023). DOI:10.1186/s13636-023-00279-6 ( pdf ) G. Iturra-Bocaz and F. Bravo-Marquez RiverText: A Python Library for Training and Evaluating Incremental Word Embeddings from Text Data Stream . In Proceedings of the 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2023), Taipei, Taiwan. Association for Computing Machinery. Pages 3027\u20133036. DOI:10.1145/3539618.3591908 ( pdf ). Matias Rojas, Casimiro Pio Carrino, Aitor Gonzalez-Agirre, Jocelyn Dunstan, and Marta Villegas. 2022. Assessing the Limits of Straightforward Models for Nested Named Entity Recognition in Spanish Clinical Narratives. In Proceedings of the 13th International Workshop on Health Text Mining and Information Analysis (LOUHI), pages 14\u201325, Abu Dhabi, United Arab Emirates (Hybrid). Association for Computational Linguistics. (pdf) . Divide and Conquer: An Extreme Multi-Label Classification Approach for Coding Diseases and Procedures in Spanish (Barros et al., Louhi 2022) (pdf) . Claudio Aracena, Fabi\u00e1n Villena, Matias Rojas, and Jocelyn Dunstan. 2022. A Knowledge-Graph-Based Intrinsic Test for Benchmarking Medical Concept Embeddings and Pretrained Language Models. In Proceedings of the 13th International Workshop on Health Text Mining and Information Analysis (LOUHI), pages 197\u2013206, Abu Dhabi, United Arab Emirates (Hybrid). Association for Computational Linguistics. (pdf) . 2022 Sipiran, I., Mendoza, A., Apaza, A., Lopez, C.: Data-driven Restoration of Digital Archaeological Pottery with Point Cloud Analysis . International Journal of Computer Vision,130(9), pp 2149\u20132165. Springer. 2022. (pdf) Romanengo, C., Raffo, A., Biasotti, S., Falcidieno, B., Fotis, V., Romanelis, I., Psatha, E., Moustakas, K., Sipiran, I., Nguyen, Q., Chu, C., Nguyen-Ngoc, K., Vo, D., To, T., Nguyen, N., Le-Pham, N., Nguyen, H., Tran, M., Qie, Y., & Anwer, N.: SHREC 2022: Fitting and recognition of simple geometric primitives on point clouds. Computers & Graphics. Vol 107, October, pp. 32-49. Elsevier. 2022. Publisher site. Thompson, E.M., Ranieri, A., Biasotti, S., Chicch\u00f3n, M., Sipiran, I., Pham, M., Nguyen-Ho, T., Nguyen, H., & Tran, M.: SHREC 2022: pothole and crack detection in the road pavement using images and RGB-D data. Computers & Graphics. Vol 107, October, pp. 161-171. Elsevier. 2022 Publisher site. Matias Rojas, Felipe Bravo-Marquez, and Jocelyn Dunstan. 2022. Simple Yet Powerful: An Overlooked Architecture for Nested Named Entity Recognition . In Proceedings of the 29th International Conference on Computational Linguistics , pages 2108\u20132117, Gyeongju, Republic of Korea. International Committee on Computational Linguistics. (pdf) Matias Rojas, Jose Barros, Kinan Martin, Mauricio Araneda-Hernandez, and Jocelyn Dunstan. 2022. PLN CMM at SocialDisNER: Improving Detection of Disease Mentions in Tweets by Using Document-Level Features . In Proceedings of The Seventh Workshop on Social Media Mining for Health Applications, Workshop & Shared Task , pages 52\u201354, Gyeongju, Republic of Korea. Association for Computational Linguistics. (pdf) Clinical Flair: A Pre-Trained Language Model for Spanish Clinical Natural Language Processing (Rojas et al., ClinicalNLP 2022) (pdf) Rojas, M., Barros, J., Araneda, M., & Dunstan, J. (2022). FLERT-Matcher: A Two-Step Approach for Clinical Named Entity Recognition and Normalization. (pdf) P. Ba\u00e9z, F. Bravo-Marquez, J. Dunstan, M. Rojas, and F. Villena Automatic Extraction of Nested Entities in Clinical Referrals in Spanish . In ACM Transactions on Computing for Healthcare (HEALTH) , Volume 3, Issue 3, July 2022. Pages 1\u201322. DOI:10.1145/3498324 ( pdf ) J. Diaz, F. Bravo-Marquez and B. Poblete, Language Modeling on Location-Based Social Networks . In ISPRS International Journal of Geo-Information , Volume 11, Number 2, Article Number 147, February 2022. DOI: 10.3390/ijgi11020147 ( pdf ) F. Bravo-Marquez and C. Tamblay Words, Tweets and Reviews: Leveraging Affective Knowledge Between Multiple Domains . In Cognitive Computation , Volume 14, January 2022. Pages 388-406. DOI: 10.1007/s12559-021-09923-9 ( pdf ) F. Bravo-Marquez, A. Khanchandani, and B. Pfahringer Incremental word-vectors for time-evolving sentiment lexicon induction . In Cognitive Computation , Volume 14, January 2022. Pages 425-441. DOI:10.1007/s12559-021-09831-y ( pdf ) H. Sarmiento, F. Bravo-Marquez, E. Graells-Garrido, and B. Poblete Identifying and Characterizing New Expressions of Community Framing during Polarization . In Proceedings of the 16th The International AAAI Conference on Web and Social Media (ICWSM 2022) , Atlanta, Georgia, USA. AAAI Press. Pages 841-851. ( pdf ) F. D. Zamora-Reina, F. Bravo-Marquez, and D. Schlechtweg LSCDiscovery: A shared task on semantic change discovery and detection in Spanish . In Proceedings of the 3rd International Workshop on Computational Approaches to Historical Language Change (LCHANGE 2022), co-located with ACL 2022 , Dublin, Ireland. Association for Computational Linguistics. Pages 149\u2013164. ( pdf ), ( codalab ) V. Araujo, A. Caravallo, S. Kundu, J. Ca\u00f1ete, M. Mendoza, R. E. Mercer, F. Bravo-Marquez, M. Moens, and A. Soto Evaluation Benchmarks for Spanish Sentence Representations . In Proceedings of the 13th Edition of The Language Resources and Evaluation Conference (LREC 2022) , Marseille, France. Pages 6024-6034. ( pdf ) J. Ca\u00f1ete, S. Donoso, F. Bravo-Marquez, A. Caravallo, and V. Araujo ALBETO and DistilBETO: Lightweight Spanish Language Models . In Proceedings of the 13th Edition of The Language Resources and Evaluation Conference (LREC 2022) , Marseille, France. Pages 4291-4298. ( pdf ) Aym\u00e9 Arango , Jorge P\u00e9rez , Barbara Poblete, Hate speech detection is not as easy as you may think: A closer look at model validation (extended version). Inf. Syst. 105 : 101584 (2022) Jesus Perez-Martin , Benjamin Bustos , Silvio Jamil Ferzoli Guimar\u00e3es , Ivan Sipiran, Jorge P\u00e9rez , Grethel Coello Said : A comprehensive review of the video-to-text problem. Artif. Intell. Rev. 55(5) : 4165-4239 (2022) 2021 Manuel Alfonseca , Manuel Cebri\u00e1n , Antonio Fern\u00e1ndez Anta , Lorenzo Coviello , Andr\u00e9s Abeliuk, Iyad Rahwan : Superintelligence Cannot be Contained: Lessons from Computability Theory. J. Artif. Intell. Res. 70 : 65-76 (2021) Hernan Sarmiento , Barbara Poblete: Crisis communication: a comparative study of communication patterns across crisis events in social media. SAC 2021 : 1711-1720 F. Tobar, F. Bravo-Marquez, J. Dunstan, J. Fontbona, A. Maass, and D. Remenik, and J.F. Silva Data Science for Engineers: A Teaching Ecosystem . In IEEE Signal Processing Magazine , Volume 38, Issue 3, May 2021. Pages 144-153. DOI:10.1109/MSP.2021.3053551 ( pdf ) A. Ansell, F. Bravo-Marquez, and B. Pfahringer PolyLM: Learning about Polysemy through Language Modeling . In Proceedings of the 16th conference of the European Chapter of the Association for Computational Linguistics (EACL 2021) , Kyiv, Ukraine. Pages 563\u2013574. ( pdf ),( code ). J. Cerezo, A. Bergel, and F. Bravo-Marquez Tools Impact on the Quality of Annotations for Chat Untangling . In Proceedings of the 2021 ACL-IJCNLP Student Research Workshop (SRW) , Bangkok, Thailand. ( pdf ) J. Mu\u00f1oz and F. Bravo-Marquez Interventions Recommendation: Professionals\u2019 Observations Analysis in Special Needs Education . In Proceedings of the 16th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2021) , Co-located with EACL 2021, Kyiv, Ukraine. Pages 171-179 ( pdf ),( code ). Jocelyn Dunstan, Fabi\u00e1n Villena , Jorge P\u00e9rez , Ren\u00e9 Lagos : Supporting the classification of patients in public hospitals in Chile by designing, deploying and validating a system based on natural language processing. BMC Medical Informatics Decis. Mak. 21(1) : 208 (2021) Aimei Yang , Ian Myoungsu Choi , Andr\u00e9s Abeliuk, Adam J. Saffer , The Influence of Interdependence in Networked Publics Spheres: How Community-Level Interactions Affect the Evolution of Topics in Online Discourse. J. Comput. Mediat. Commun. 26(3) : 148-166 (2021) Zihao He , Negar Mokhberian , Ant\u00f3nio C\u00e2mara , Andr\u00e9s Abeliuk, Kristina Lerman : Detecting Polarized Topics Using Partisanship-aware Contextualized Topic Embeddings. EMNLP (Findings) 2021 : 2102-2118 Nathan Bartley , Andr\u00e9s Abeliuk, Emilio Ferrara , Kristina Lerman : Auditing Algorithmic Bias on Twitter. WebSci 2021 : 65-73 2020 Barbara Poblete , Jorge P\u00e9rez: Minding the AI gap in LATAM. Commun. ACM 63(11) : 61-63 (2020) Jose Miguel Herrera , Denis Parra , Barbara Poblete: Social QA in non-CQA platforms. Future Gener. Comput. Syst. 105 : 631-649 (2020) Henry Rosales-M\u00e9ndez , Aidan Hogan , Barbara Poblete: Fine-Grained Entity Linking. J. Web Semant. 65 : 100600 (2020) Javier Carrasco , Aidan Hogan , Jorge P\u00e9rez: Laconic Image Classification: Human vs. Machine Performance. CIKM 2020 : 115-124 Jorge P\u00e9rez, Francisco Plana : Food sharing gave birth to social networks. CogSci 2020 P. B\u00e1ez, F. Villena, M. Rojas, M. Dur\u00e1n, and J. Dunstan The Chilean Waiting List Corpus: a new resource for clinical Named Entity Recognition in Spanish , In Proceedings of the 3rd Clinical Natural Language Processing Workshop , November, 291-300, 2020. DOI:10.18653/v1/2020.clinicalnlp-1.32 ( pdf ) Model Interpretability through the Lens of Computational Complexity Pablo Barcel\u00f3, Mikael Monet, Jorge P\u00e9rez, Bernardo Subercaseaux NeurIPS 2020 J. Diaz, B. Poblete, and F. Bravo-Marquez An Integrated Model for Textual Social Media Data with Spatio-Temporal Dimensions , In Information Processing & Management , Volume 57, Issue 5, 2020. DOI:10.1016/j.ipm.2020.102219 ( pdf ) D.G. Trye, A.S. Calude, F. Bravo-Marquez, and T.T. Keegan Hybrid Hashtags: #YouKnowYoureAKiwiWhen your Tweet contains M\u0101ori and English , In Frontiers in Artificial Intelligence, section Language and Computation Volume 3, Article 15, April 2020. DOI: 10.3389/frai.2020.00015. ( pdf | supplementary Material ) P. Badilla, F. Bravo-Marquez, and J. P\u00e9rez WEFE: The Word Embeddings Fairness Evaluation Framework In Proceedings of the 29th International Joint Conference on Artificial Intelligence and the 17th Pacific Rim International Conference on Artificial Intelligence (IJCAI-PRICAI 2020) , Yokohama, Japan. Pages 430-436. DOI:10.24963/ijcai.2020/60. Acceptance rate: 12.6%. ( pdf ),( code ). The Logical Expressiveness of Graph Neural Networks Pablo Barcel\u00f3, Egor V. Kostylev, Mikael Monet, Jorge P\u00e9rez, Juan Reutter and Juan-Pablo Silva, ICLR 2020 ( talk , slides , poster ) Spanish Pre-Trained BERT Model and Evaluation Data Jose Ca\u00f1ete, Gabriel Chaperon, Rodrigo Fuentes, Jou-Hui Ho, Hojin Kang and Jorge P\u00e9rez PML4DC @ ICLR 2020 ( talk , slides , code ) Predicting Unplanned Readmissions with Highly Unstructured Data Constanza Fierro, Jorge P\u00e9rez, and Javier Mora, AI4AH @ ICLR 2020. Jesus Perez-Martin , Benjamin Bustos , Jorge P\u00e9rez: Attentive Visual Semantic Specialized Network for Video Captioning. ICPR 2020 : 5767-5774 2019 Jorge P\u00e9rez, Javier Marinkovi\u0107 and Pablo Barcel\u00f3, On the Turing Completeness of Modern Neural Network Architectures, ICLR 2019. ( pdf ) ( poster ) Aym\u00e9 Arango, Jorge P\u00e9rez, Barbara Poblete , Hate Speech Detection is Not as Easy as You May Think: A Closer Look at Model Validation, SIGIR 2019. ( pdf ) Pablo Barcel\u00f3, Nelson Higuera, Jorge P\u00e9rez and Bernardo Subercaseaux, Expressiveness of Matrix and Tensor Query Languages in terms of ML Operators, DEEM @ SIGMOD 2019. ( pdf ) ( slides ) F. Bravo-Marquez, E. Frank, B. Pfahringer, and S. M. Mohammad AffectiveTweets: a WEKA Package for Analyzing Affect in Tweets , In Journal of Machine Learning Research 20(92): Pages 1\u22126, 2019. ( pdf ) S. Lang, F. Bravo-Marquez, C. Beckham, M. Hall, and E. Frank WekaDeeplearning4j: a Deep Learning Package for Weka based on DeepLearning4j , In Knowledge-Based Systems , Volume 178, 15 August 2019, Pages 48-50. DOI: 10.1016/j.knosys.2019.04.013 ( pdf ) A. Ansell, F. Bravo-Marquez, and B. Pfahringer An ELMo-inspired approach to SemDeep-5's Word-in-Context task . In Proceedings of the 5th Workshop on Semantic Deep Learning (SemDeep-5) co-located with IJCAI 2019 in Macau, China. ( pdf ) D. Trye, A. S. Calude, F. Bravo-Marquez, and T. T Keegan M\u0101ori Loanwords: A Corpus of New Zealand English Tweets . In Proceedings of the 2019 ACL Student Research Workshop (SRW), Florence, Italy. ( pdf ) F. Villena and J. Dunstan Obtenci\u00f3n autom\u00e1tica de palabras clave en textos cl\u00ednicos: una aplicaci\u00f3n de procesamiento del lenguaje natural a datos masivos de sospecha diagn\u00f3stica en Chile . In Revista m\u00e9dica de Chile , Volume 147, 2019. DOI:http://dx.doi.org/10.4067/s0034-98872019001001229 ( pdf ) Marcelo Mendoza , Barbara Poblete, Ignacio Valderrama : Nowcasting earthquake damages with Twitter. EPJ Data Sci. 8(1) : 3:1-3:23 (2019) Henry Rosales-M\u00e9ndez , Aidan Hogan , Barbara Poblete: Fine-Grained Evaluation for Entity Linking. EMNLP/IJCNLP (1) 2019 : 718-727 Marcelo Mendoza , B\u00e1rbara Poblete, Ignacio Valderrama : Estimating Ground Shaking Regions with Social Media Propagation Trees. HCI (13) 2019 : 356-369 Mauricio Quezada , Barbara Poblete: A Lightweight Representation of News Events on Social Media. SIGIR 2019 : 1049-1052 Juglar Diaz , Barbara Poblete: Car Theft Reports: a Temporal Analysis from a Social Media Perspective. WWW (Companion Volume) 2019 : 779-782 Karen Or\u00f3stica , Barbara Poblete: Mining the Relationship BetweenCar Theft and Places of Social Interest in Santiago Chile. WWW (Companion Volume) 2019 : 811-814 Henry Rosales-M\u00e9ndez , Aidan Hogan , Barbara Poblete: NIFify: Towards Better Quality Entity Linking Datasets. WWW (Companion Volume) 2019 : 815-818","title":"Publications"},{"location":"publications/#2023","text":"M. Araneda, F. Bravo-Marquez, D. Parra, and R.F C\u00e1diz MUSIB: Musical Score Inpainting Benchmark . In EURASIP Journal on Audio, Speech, and Music Processing, 2023, 19 (2023). DOI:10.1186/s13636-023-00279-6 ( pdf ) G. Iturra-Bocaz and F. Bravo-Marquez RiverText: A Python Library for Training and Evaluating Incremental Word Embeddings from Text Data Stream . In Proceedings of the 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2023), Taipei, Taiwan. Association for Computing Machinery. Pages 3027\u20133036. DOI:10.1145/3539618.3591908 ( pdf ). Matias Rojas, Casimiro Pio Carrino, Aitor Gonzalez-Agirre, Jocelyn Dunstan, and Marta Villegas. 2022. Assessing the Limits of Straightforward Models for Nested Named Entity Recognition in Spanish Clinical Narratives. In Proceedings of the 13th International Workshop on Health Text Mining and Information Analysis (LOUHI), pages 14\u201325, Abu Dhabi, United Arab Emirates (Hybrid). Association for Computational Linguistics. (pdf) . Divide and Conquer: An Extreme Multi-Label Classification Approach for Coding Diseases and Procedures in Spanish (Barros et al., Louhi 2022) (pdf) . Claudio Aracena, Fabi\u00e1n Villena, Matias Rojas, and Jocelyn Dunstan. 2022. A Knowledge-Graph-Based Intrinsic Test for Benchmarking Medical Concept Embeddings and Pretrained Language Models. In Proceedings of the 13th International Workshop on Health Text Mining and Information Analysis (LOUHI), pages 197\u2013206, Abu Dhabi, United Arab Emirates (Hybrid). Association for Computational Linguistics. (pdf) .","title":"2023"},{"location":"publications/#2022","text":"Sipiran, I., Mendoza, A., Apaza, A., Lopez, C.: Data-driven Restoration of Digital Archaeological Pottery with Point Cloud Analysis . International Journal of Computer Vision,130(9), pp 2149\u20132165. Springer. 2022. (pdf) Romanengo, C., Raffo, A., Biasotti, S., Falcidieno, B., Fotis, V., Romanelis, I., Psatha, E., Moustakas, K., Sipiran, I., Nguyen, Q., Chu, C., Nguyen-Ngoc, K., Vo, D., To, T., Nguyen, N., Le-Pham, N., Nguyen, H., Tran, M., Qie, Y., & Anwer, N.: SHREC 2022: Fitting and recognition of simple geometric primitives on point clouds. Computers & Graphics. Vol 107, October, pp. 32-49. Elsevier. 2022. Publisher site. Thompson, E.M., Ranieri, A., Biasotti, S., Chicch\u00f3n, M., Sipiran, I., Pham, M., Nguyen-Ho, T., Nguyen, H., & Tran, M.: SHREC 2022: pothole and crack detection in the road pavement using images and RGB-D data. Computers & Graphics. Vol 107, October, pp. 161-171. Elsevier. 2022 Publisher site. Matias Rojas, Felipe Bravo-Marquez, and Jocelyn Dunstan. 2022. Simple Yet Powerful: An Overlooked Architecture for Nested Named Entity Recognition . In Proceedings of the 29th International Conference on Computational Linguistics , pages 2108\u20132117, Gyeongju, Republic of Korea. International Committee on Computational Linguistics. (pdf) Matias Rojas, Jose Barros, Kinan Martin, Mauricio Araneda-Hernandez, and Jocelyn Dunstan. 2022. PLN CMM at SocialDisNER: Improving Detection of Disease Mentions in Tweets by Using Document-Level Features . In Proceedings of The Seventh Workshop on Social Media Mining for Health Applications, Workshop & Shared Task , pages 52\u201354, Gyeongju, Republic of Korea. Association for Computational Linguistics. (pdf) Clinical Flair: A Pre-Trained Language Model for Spanish Clinical Natural Language Processing (Rojas et al., ClinicalNLP 2022) (pdf) Rojas, M., Barros, J., Araneda, M., & Dunstan, J. (2022). FLERT-Matcher: A Two-Step Approach for Clinical Named Entity Recognition and Normalization. (pdf) P. Ba\u00e9z, F. Bravo-Marquez, J. Dunstan, M. Rojas, and F. Villena Automatic Extraction of Nested Entities in Clinical Referrals in Spanish . In ACM Transactions on Computing for Healthcare (HEALTH) , Volume 3, Issue 3, July 2022. Pages 1\u201322. DOI:10.1145/3498324 ( pdf ) J. Diaz, F. Bravo-Marquez and B. Poblete, Language Modeling on Location-Based Social Networks . In ISPRS International Journal of Geo-Information , Volume 11, Number 2, Article Number 147, February 2022. DOI: 10.3390/ijgi11020147 ( pdf ) F. Bravo-Marquez and C. Tamblay Words, Tweets and Reviews: Leveraging Affective Knowledge Between Multiple Domains . In Cognitive Computation , Volume 14, January 2022. Pages 388-406. DOI: 10.1007/s12559-021-09923-9 ( pdf ) F. Bravo-Marquez, A. Khanchandani, and B. Pfahringer Incremental word-vectors for time-evolving sentiment lexicon induction . In Cognitive Computation , Volume 14, January 2022. Pages 425-441. DOI:10.1007/s12559-021-09831-y ( pdf ) H. Sarmiento, F. Bravo-Marquez, E. Graells-Garrido, and B. Poblete Identifying and Characterizing New Expressions of Community Framing during Polarization . In Proceedings of the 16th The International AAAI Conference on Web and Social Media (ICWSM 2022) , Atlanta, Georgia, USA. AAAI Press. Pages 841-851. ( pdf ) F. D. Zamora-Reina, F. Bravo-Marquez, and D. Schlechtweg LSCDiscovery: A shared task on semantic change discovery and detection in Spanish . In Proceedings of the 3rd International Workshop on Computational Approaches to Historical Language Change (LCHANGE 2022), co-located with ACL 2022 , Dublin, Ireland. Association for Computational Linguistics. Pages 149\u2013164. ( pdf ), ( codalab ) V. Araujo, A. Caravallo, S. Kundu, J. Ca\u00f1ete, M. Mendoza, R. E. Mercer, F. Bravo-Marquez, M. Moens, and A. Soto Evaluation Benchmarks for Spanish Sentence Representations . In Proceedings of the 13th Edition of The Language Resources and Evaluation Conference (LREC 2022) , Marseille, France. Pages 6024-6034. ( pdf ) J. Ca\u00f1ete, S. Donoso, F. Bravo-Marquez, A. Caravallo, and V. Araujo ALBETO and DistilBETO: Lightweight Spanish Language Models . In Proceedings of the 13th Edition of The Language Resources and Evaluation Conference (LREC 2022) , Marseille, France. Pages 4291-4298. ( pdf ) Aym\u00e9 Arango , Jorge P\u00e9rez , Barbara Poblete, Hate speech detection is not as easy as you may think: A closer look at model validation (extended version). Inf. Syst. 105 : 101584 (2022) Jesus Perez-Martin , Benjamin Bustos , Silvio Jamil Ferzoli Guimar\u00e3es , Ivan Sipiran, Jorge P\u00e9rez , Grethel Coello Said : A comprehensive review of the video-to-text problem. Artif. Intell. Rev. 55(5) : 4165-4239 (2022)","title":"2022"},{"location":"publications/#2021","text":"Manuel Alfonseca , Manuel Cebri\u00e1n , Antonio Fern\u00e1ndez Anta , Lorenzo Coviello , Andr\u00e9s Abeliuk, Iyad Rahwan : Superintelligence Cannot be Contained: Lessons from Computability Theory. J. Artif. Intell. Res. 70 : 65-76 (2021) Hernan Sarmiento , Barbara Poblete: Crisis communication: a comparative study of communication patterns across crisis events in social media. SAC 2021 : 1711-1720 F. Tobar, F. Bravo-Marquez, J. Dunstan, J. Fontbona, A. Maass, and D. Remenik, and J.F. Silva Data Science for Engineers: A Teaching Ecosystem . In IEEE Signal Processing Magazine , Volume 38, Issue 3, May 2021. Pages 144-153. DOI:10.1109/MSP.2021.3053551 ( pdf ) A. Ansell, F. Bravo-Marquez, and B. Pfahringer PolyLM: Learning about Polysemy through Language Modeling . In Proceedings of the 16th conference of the European Chapter of the Association for Computational Linguistics (EACL 2021) , Kyiv, Ukraine. Pages 563\u2013574. ( pdf ),( code ). J. Cerezo, A. Bergel, and F. Bravo-Marquez Tools Impact on the Quality of Annotations for Chat Untangling . In Proceedings of the 2021 ACL-IJCNLP Student Research Workshop (SRW) , Bangkok, Thailand. ( pdf ) J. Mu\u00f1oz and F. Bravo-Marquez Interventions Recommendation: Professionals\u2019 Observations Analysis in Special Needs Education . In Proceedings of the 16th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2021) , Co-located with EACL 2021, Kyiv, Ukraine. Pages 171-179 ( pdf ),( code ). Jocelyn Dunstan, Fabi\u00e1n Villena , Jorge P\u00e9rez , Ren\u00e9 Lagos : Supporting the classification of patients in public hospitals in Chile by designing, deploying and validating a system based on natural language processing. BMC Medical Informatics Decis. Mak. 21(1) : 208 (2021) Aimei Yang , Ian Myoungsu Choi , Andr\u00e9s Abeliuk, Adam J. Saffer , The Influence of Interdependence in Networked Publics Spheres: How Community-Level Interactions Affect the Evolution of Topics in Online Discourse. J. Comput. Mediat. Commun. 26(3) : 148-166 (2021) Zihao He , Negar Mokhberian , Ant\u00f3nio C\u00e2mara , Andr\u00e9s Abeliuk, Kristina Lerman : Detecting Polarized Topics Using Partisanship-aware Contextualized Topic Embeddings. EMNLP (Findings) 2021 : 2102-2118 Nathan Bartley , Andr\u00e9s Abeliuk, Emilio Ferrara , Kristina Lerman : Auditing Algorithmic Bias on Twitter. WebSci 2021 : 65-73","title":"2021"},{"location":"publications/#2020","text":"Barbara Poblete , Jorge P\u00e9rez: Minding the AI gap in LATAM. Commun. ACM 63(11) : 61-63 (2020) Jose Miguel Herrera , Denis Parra , Barbara Poblete: Social QA in non-CQA platforms. Future Gener. Comput. Syst. 105 : 631-649 (2020) Henry Rosales-M\u00e9ndez , Aidan Hogan , Barbara Poblete: Fine-Grained Entity Linking. J. Web Semant. 65 : 100600 (2020) Javier Carrasco , Aidan Hogan , Jorge P\u00e9rez: Laconic Image Classification: Human vs. Machine Performance. CIKM 2020 : 115-124 Jorge P\u00e9rez, Francisco Plana : Food sharing gave birth to social networks. CogSci 2020 P. B\u00e1ez, F. Villena, M. Rojas, M. Dur\u00e1n, and J. Dunstan The Chilean Waiting List Corpus: a new resource for clinical Named Entity Recognition in Spanish , In Proceedings of the 3rd Clinical Natural Language Processing Workshop , November, 291-300, 2020. DOI:10.18653/v1/2020.clinicalnlp-1.32 ( pdf ) Model Interpretability through the Lens of Computational Complexity Pablo Barcel\u00f3, Mikael Monet, Jorge P\u00e9rez, Bernardo Subercaseaux NeurIPS 2020 J. Diaz, B. Poblete, and F. Bravo-Marquez An Integrated Model for Textual Social Media Data with Spatio-Temporal Dimensions , In Information Processing & Management , Volume 57, Issue 5, 2020. DOI:10.1016/j.ipm.2020.102219 ( pdf ) D.G. Trye, A.S. Calude, F. Bravo-Marquez, and T.T. Keegan Hybrid Hashtags: #YouKnowYoureAKiwiWhen your Tweet contains M\u0101ori and English , In Frontiers in Artificial Intelligence, section Language and Computation Volume 3, Article 15, April 2020. DOI: 10.3389/frai.2020.00015. ( pdf | supplementary Material ) P. Badilla, F. Bravo-Marquez, and J. P\u00e9rez WEFE: The Word Embeddings Fairness Evaluation Framework In Proceedings of the 29th International Joint Conference on Artificial Intelligence and the 17th Pacific Rim International Conference on Artificial Intelligence (IJCAI-PRICAI 2020) , Yokohama, Japan. Pages 430-436. DOI:10.24963/ijcai.2020/60. Acceptance rate: 12.6%. ( pdf ),( code ). The Logical Expressiveness of Graph Neural Networks Pablo Barcel\u00f3, Egor V. Kostylev, Mikael Monet, Jorge P\u00e9rez, Juan Reutter and Juan-Pablo Silva, ICLR 2020 ( talk , slides , poster ) Spanish Pre-Trained BERT Model and Evaluation Data Jose Ca\u00f1ete, Gabriel Chaperon, Rodrigo Fuentes, Jou-Hui Ho, Hojin Kang and Jorge P\u00e9rez PML4DC @ ICLR 2020 ( talk , slides , code ) Predicting Unplanned Readmissions with Highly Unstructured Data Constanza Fierro, Jorge P\u00e9rez, and Javier Mora, AI4AH @ ICLR 2020. Jesus Perez-Martin , Benjamin Bustos , Jorge P\u00e9rez: Attentive Visual Semantic Specialized Network for Video Captioning. ICPR 2020 : 5767-5774","title":"2020"},{"location":"publications/#2019","text":"Jorge P\u00e9rez, Javier Marinkovi\u0107 and Pablo Barcel\u00f3, On the Turing Completeness of Modern Neural Network Architectures, ICLR 2019. ( pdf ) ( poster ) Aym\u00e9 Arango, Jorge P\u00e9rez, Barbara Poblete , Hate Speech Detection is Not as Easy as You May Think: A Closer Look at Model Validation, SIGIR 2019. ( pdf ) Pablo Barcel\u00f3, Nelson Higuera, Jorge P\u00e9rez and Bernardo Subercaseaux, Expressiveness of Matrix and Tensor Query Languages in terms of ML Operators, DEEM @ SIGMOD 2019. ( pdf ) ( slides ) F. Bravo-Marquez, E. Frank, B. Pfahringer, and S. M. Mohammad AffectiveTweets: a WEKA Package for Analyzing Affect in Tweets , In Journal of Machine Learning Research 20(92): Pages 1\u22126, 2019. ( pdf ) S. Lang, F. Bravo-Marquez, C. Beckham, M. Hall, and E. Frank WekaDeeplearning4j: a Deep Learning Package for Weka based on DeepLearning4j , In Knowledge-Based Systems , Volume 178, 15 August 2019, Pages 48-50. DOI: 10.1016/j.knosys.2019.04.013 ( pdf ) A. Ansell, F. Bravo-Marquez, and B. Pfahringer An ELMo-inspired approach to SemDeep-5's Word-in-Context task . In Proceedings of the 5th Workshop on Semantic Deep Learning (SemDeep-5) co-located with IJCAI 2019 in Macau, China. ( pdf ) D. Trye, A. S. Calude, F. Bravo-Marquez, and T. T Keegan M\u0101ori Loanwords: A Corpus of New Zealand English Tweets . In Proceedings of the 2019 ACL Student Research Workshop (SRW), Florence, Italy. ( pdf ) F. Villena and J. Dunstan Obtenci\u00f3n autom\u00e1tica de palabras clave en textos cl\u00ednicos: una aplicaci\u00f3n de procesamiento del lenguaje natural a datos masivos de sospecha diagn\u00f3stica en Chile . In Revista m\u00e9dica de Chile , Volume 147, 2019. DOI:http://dx.doi.org/10.4067/s0034-98872019001001229 ( pdf ) Marcelo Mendoza , Barbara Poblete, Ignacio Valderrama : Nowcasting earthquake damages with Twitter. EPJ Data Sci. 8(1) : 3:1-3:23 (2019) Henry Rosales-M\u00e9ndez , Aidan Hogan , Barbara Poblete: Fine-Grained Evaluation for Entity Linking. EMNLP/IJCNLP (1) 2019 : 718-727 Marcelo Mendoza , B\u00e1rbara Poblete, Ignacio Valderrama : Estimating Ground Shaking Regions with Social Media Propagation Trees. HCI (13) 2019 : 356-369 Mauricio Quezada , Barbara Poblete: A Lightweight Representation of News Events on Social Media. SIGIR 2019 : 1049-1052 Juglar Diaz , Barbara Poblete: Car Theft Reports: a Temporal Analysis from a Social Media Perspective. WWW (Companion Volume) 2019 : 779-782 Karen Or\u00f3stica , Barbara Poblete: Mining the Relationship BetweenCar Theft and Places of Social Interest in Santiago Chile. WWW (Companion Volume) 2019 : 811-814 Henry Rosales-M\u00e9ndez , Aidan Hogan , Barbara Poblete: NIFify: Towards Better Quality Entity Linking Datasets. WWW (Companion Volume) 2019 : 815-818","title":"2019"},{"location":"resources/","text":"We count with the following GPU-equipped machines: RELELA-01 CPU: Intel Core i7-9700F RAM: 128 GB DDR4 HDD1: 500GB Crucial P2 PCIe M.2 NVME HDD2: 480GB WDC WDS480G2G0B M.2 SATA3 GPU0: GeForce RTX 3090 24GB GPU1: GeForce RTX 3090 24GB RELELA-02 CPU: Intel Core i7-11700K RAM: 128 GB DDR4 HDD1: 500GB Crucial P2 PCIe M.2 NVME HDD2: 2TB Kingston NV1 PCIe M.2 NVME GPU0: GeForce RTX 3090 24GB GPU1: GeForce RTX 3090 24GB RELELA-03 CPU : Intel i7-11700K RAM : 128 GB DDR4 HDD1 : 960GB NVME HDD2 : 2TB SATA3 SSD HDD2 : 2TB SATA3 SSD GPU0: GeForce RTX 3090 24GB GPU1: GeForce RTX 3090 24GB RELELA-04 CPU : AMD Ryzen 7 5700X 8-Core Processor RAM : 96GB DDR4 HDD1: 2TB KINGSTON SFYRD2000G PCIe M.2 NVME GPU0: GeForce RTX A6000 48GB GPU1: GeForce RTX A6000 48GB GPUs connected via NVLINK RELELA-05 CPU : AMD Ryzen 7 5700X 8-Core Processor RAM : 128GB DDR4 HDD1: 2TB KINGSTON SFYRD2000G PCIe M.2 NVME GPU0: GeForce RTX A6000 48GB GPU1: GeForce RTX A6000 48GB GPUs connected via NVLINK RELELA-06 CPU : AMD EPYC 7282 16-Core Processor RAM : 128GB DDR4 HDD1: 1TB Samsung SSD 980 PRO PCIe M.2 NVME HDD2: 4TB Seagate Exos 7E10 SATA3 GPU0: GeForce RTX A5000 24GB GPU1: GeForce RTX A5000 24GB GPU2: GeForce RTX A5000 24GB","title":"Computing Resources"},{"location":"resources/#relela-01","text":"CPU: Intel Core i7-9700F RAM: 128 GB DDR4 HDD1: 500GB Crucial P2 PCIe M.2 NVME HDD2: 480GB WDC WDS480G2G0B M.2 SATA3 GPU0: GeForce RTX 3090 24GB GPU1: GeForce RTX 3090 24GB","title":"RELELA-01"},{"location":"resources/#relela-02","text":"CPU: Intel Core i7-11700K RAM: 128 GB DDR4 HDD1: 500GB Crucial P2 PCIe M.2 NVME HDD2: 2TB Kingston NV1 PCIe M.2 NVME GPU0: GeForce RTX 3090 24GB GPU1: GeForce RTX 3090 24GB","title":"RELELA-02"},{"location":"resources/#relela-03","text":"CPU : Intel i7-11700K RAM : 128 GB DDR4 HDD1 : 960GB NVME HDD2 : 2TB SATA3 SSD HDD2 : 2TB SATA3 SSD GPU0: GeForce RTX 3090 24GB GPU1: GeForce RTX 3090 24GB","title":"RELELA-03"},{"location":"resources/#relela-04","text":"CPU : AMD Ryzen 7 5700X 8-Core Processor RAM : 96GB DDR4 HDD1: 2TB KINGSTON SFYRD2000G PCIe M.2 NVME GPU0: GeForce RTX A6000 48GB GPU1: GeForce RTX A6000 48GB GPUs connected via NVLINK","title":"RELELA-04"},{"location":"resources/#relela-05","text":"CPU : AMD Ryzen 7 5700X 8-Core Processor RAM : 128GB DDR4 HDD1: 2TB KINGSTON SFYRD2000G PCIe M.2 NVME GPU0: GeForce RTX A6000 48GB GPU1: GeForce RTX A6000 48GB GPUs connected via NVLINK","title":"RELELA-05"},{"location":"resources/#relela-06","text":"CPU : AMD EPYC 7282 16-Core Processor RAM : 128GB DDR4 HDD1: 1TB Samsung SSD 980 PRO PCIe M.2 NVME HDD2: 4TB Seagate Exos 7E10 SATA3 GPU0: GeForce RTX A5000 24GB GPU1: GeForce RTX A5000 24GB GPU2: GeForce RTX A5000 24GB","title":"RELELA-06"},{"location":"seminars/","text":"We hold weekly meetings on Wednesdays at 3PM at Auditorio Philippe Frajolet (303) Tercer Piso Edificio Poniente Beauchef 851. Our meeting's calendar Some of our seminars are available in our Playlist . Minutas (In Spanish) 02/08/2023 Ricardo Baeza-Yates present\u00f3 su seminario titulado: Inteligencia Artificial Responsable ( video ). 10/07/2023 Mircea Petrache present\u00f3 su seminario titulado: Conformal Language Modeling ( slides ). 07/05/2023 Edison Marrese-Taylor present\u00f3 su seminario titulado: Learning to Represent Edits ( slides ). 31/05/2023 Ciclo de charlas ChatGPT: Panel de Discusi\u00f3n - Alcances y l\u00edmites de los modelos de lenguaje. Panelitas: Cristi\u00e1n Buc (CENIA), slides mini-presentaci\u00f3n. Magdalena Salda\u00f1a (UC/IMFD). Mart\u00edn C\u00e1ceres (MINEDUC). Felipe Tobar (IDIA Uchile, CMM). Moderador: Claudio Guti\u00e9rrez (DCC-IMFD). 24/05/2023 Ciclo de charlas ChatGPT en la Industria: posibilidades y proyecciones ( video ): Jorge Per\u00e9z present\u00f3 su seminario: IA sin far\u00e1ndula ( slides ). Manuel Pe\u00f1a present\u00f3 su seminario: GPT y Agentes, Como Conversar con tu App ( slides ). 17/05/2023 Ciclo de Charlas de ChatGPT: Gabriela Arriagada present\u00f3 su seminario, Desaf\u00edos \u00e9ticos actuales a la luz de la revoluci\u00f3n sociotecnol\u00f3gica del GPT3 y 4 ( slides )( video ). 10/05/2023 Ciclo de Charlas ChatGPT: Felipe Bravo present\u00f3 su seminario titulado, Un recorrido por los Modelos de Lenguaje: desde Shannon a GPT-4 ( slides )( video ). 04/05/2023 Ciclo de Charlas ChatGPT: Jorge Ortiz present\u00f3 su seminario titulado, \u00bfPuede ChatGPT conquistar el mundo? Lenguaje humano vs lenguaje de m\u00e1quina ( slides )( video ). 26/04/2023 Mauricio Araneda present\u00f3 su seminario titulado: MUSIB: Musical Score Inpainting Benchmark ( slides ). 19/04/2023 Felipe Urrutia present\u00f3 su seminario titulado: The Role of Natural Language Processing in Advancing Competency-Based Education and Mathematics Learning in Fourth Graders ( slides ) 12/04/2023 Gabriel Iturra present\u00f3 su charla de tesis II titulada: RiverText: A Framework for Training and Evaluating Incremental Word Embeddings from Text Data Streams ( slides )( v\u00eddeo ). 05/04/2023 Valentin Barriere present\u00f3 su seminario titulada: Multilingual Multi-target Stance Recognition in Online Public Consultations ( slides ) 29/03/2023 Jos\u00e9 Ca\u00f1ete present\u00f3 su charla de tesis II titulada: Light and Fast Language Models for Spanish Through Compression Techniques ( slides )( video ). 25/01/2023 Valentin Barriere present\u00f3 su seminario titulado: Two improvements for mutli-lingual in-context classification over tweets using transformers ( slides ). 18/01/2023 Presentaciones rel\u00e1mpago de los miembros de Relela ( slides ). 11/01/2023 Mircea Petrache present\u00f3 su seminario titulada: Word embeddings analogies and paraphrases: proofs and open problems ( slides ). 04/01/2023 Se realizo una reuni\u00f3n de coordinaci\u00f3n para futuras actividades Relela, donde se tomaron los siguientes acuerdos: Evento con presentaciones rel\u00e1mpagos sobre el tema que cada uno trabaja (2 minutos de presentaci\u00f3n con 1 diapositiva). Profesores de ReLeLa incorporar\u00e1n a sus estudiantes. Presentaci\u00f3n periodica de papers (semanal). Definir roles en el grupo. 21/12/2022 Se presentaron 2 charlas de Tesis I de mag\u00edster, 1) Clemente Henr\u00edquez: Evolution of topic and issues in Chilean news ( slides ), 2) Ignacio Meza: Benchmarking video action features for the video temporary sentence grounding task ( slides ). 14/12/2022 Jorge Ortiz present\u00f3 su charla de Tesis I de mag\u00edster titulada: \"Attitude Analysis: a linguistic-based task for detailed position detection in texts\" ( slides ). 07/12/2022 Mar\u00eda Jos\u00e9 Zambrano present\u00f3 su charla de Tesis I de mag\u00edster titulada: \"Comparison and Improvement of Bias Mitigation Algorithms for Word Embeddings\" ( slides ). 22/07/2022 Mauricio Araneda present\u00f3 su charla de Tesis II de mag\u00edster titulada: \"Computers making music? Measuring current progress with MUSIB evaluation\" ( slides ). 13/07/2022 Se presentaron 3 charlas de Tesis I de mag\u00edster, 1) Jos\u00e9 Espina: Marco de trabajo de calibraci\u00f3n r\u00e1pida de confianza, en toma de decisiones asistidas por IA, 2) Alfonso Valderrama : Entrop\u00eda de Shannon como medida de predictibilidad de sistemas de recomendaci\u00f3n, 3)Ignacio Nu\u00f1ez: Defining an extensible architecture for a multi-task GUI-oriented Machine Learning software. 22/06/2022 Juan Pablo Silva present\u00f3 su charla de Tesis II de mag\u00edster titulada: \"Logic-based interpretability of Graph Neural Networks\" 28/04/2022 Miguel Cordero del Servicio de Salud Metropolitano Sur Oriente de Santiago de Chile, nos present\u00f3 \"Tendencias de la salud mental en los primeros 20 a\u00f1os de vida de usuarios/as de servicios de salud en el sur oriente de Santiago: \u00bfqu\u00e9 podemos aprender de las notas medicas?\" 05/01/2022 Rolando Kindelan nos di\u00f3 una charla titulado \"An\u00e1lisis Topol\u00f3gico de Datos (TDA): antecedentes, actualidad y perspectivas\" 22/12/2021 El alumno de mag\u00edster Jos\u00e9 Ca\u00f1ete present\u00f3 su charla de tesis I: \"Efficient models for Spanish NLP through Knowledge Distillation\" ( slides )( video ) 15/12/2021 El alumno de mag\u00edster Mat\u00edas Rojas present\u00f3 su charla de tesis II titulada: Nested named entity recognition in diagnoses from the Chilean Waiting List in public hospitals ( slides ) 01/12/2021 Los alumnos de mag\u00edster Humberto Rodrigues y David Rojas presentaron sus charlas de Tesis I tituladas \"Exploring bias metric strategies in contextualized embeddings\" y \"Word Embedding Bias Origin Detection\". 19/11/2021 Javier Mu\u00f1oz present\u00f3 su trabajo de tesis de mag\u00edster: \"Aprendizaje multi-instancia multi-etiqueta en la recomendaci\u00f3n de intervenciones\" 29/09/2021 Cristian Ahumada present\u00f3 su trabajo: \"Dise\u00f1o y desarrollo de un software de apoyo para el aprendizaje del Mapuzugun\" 22/09/2021 Mauricio Araneda present\u00f3 un tutorial sobre VAEs. ( slides ) 01/09/2021 Pablo Badilla nos habl\u00f3 sobre su trabajo en el proyecto \"lxs 400 \" 07/07/2021 Los alumnos de mag\u00edster Basti\u00e1n Matamala, Mauricio Araneda y Gabriel Iturra presentaron sus charlas de Tesis I. 05/05/2021 Carolina Chiu habl\u00f3 sobre el testeo de word embeddings en el contexto cl\u00ednico. 21/04/2021 Cristi\u00e1n Candia (UDD) nos habl\u00f3 sobre su trabajo en \"Inteligencia Colectiva\". 14/04/2021 Gast\u00f3n L'huillier nos habl\u00f3 sobre Machine Learning Engineering, infraestructura y todos los desaf\u00edos de poner en modelos en producci\u00f3n. ( slides ) 24/03/2021 Andr\u00e9s Abeliuk present\u00f3 su l\u00ednea de investigaci\u00f3n en tema de polarizaci\u00f3n. 17/03/2021 Alan Ansell present\u00f3 su trabajo sobre PolyLM, un LM pol\u00edsemico ( video ) 29/01/2021 Felipe Bravo dio un tutorial introductorio a la inferencia Bayesiana. 20/01/2021 Daniel Diomedi present\u00f3 su charla de Tesis II sobre Question Answering sobre Wikidata usando Entity Linking and Neural Semantic Parsing. 13/01/2021 Javier Vera present\u00f3 su trabajo sobre Aproximaciones computacionales a la diversidad ling\u00fc\u00edstica de Sudam\u00e9rica (la charla fue grabada). 06/01/2021 Pablo Badilla present\u00f3 su trabajo sobre sesgo en word embeddings. 23/12/2020 Bernardo Subercaseaux nos habl\u00f3 de su trabajo de investigaci\u00f3n acerca de formalizaciones de interpretabilidad de modelos de aprendizaje autom\u00e1tico desde el punto de vista de la complejidad computacional (slides, video ) 17/12/2020 Jorge Ortiz nos habl\u00f3 sobre la ling\u00fc\u00edstica s\u00edstemico funcional y sus potenciales v\u00ednculos con NLP. ( slides , video ) 02/12/2020: Mat\u00edas Rojas present\u00f3 su charla de Tesis I de mag\u00edster sobre nested NER en el Chilean Waiting List Corpus. 11/11/2020: Cristi\u00e1n Tamblay present\u00f3 su trabajo de memoria sobre transferencia de modelos de sentimiento y emoci\u00f3n en distintos dominios. 23/09/2020: Hern\u00e1n Sarmiento practic\u00f3 su charla de propuesta de tesis doctoral titulada: \"A Domain-independent and Multilingual Approach for Crisis Event Detection and Understanding\" 09/09/2020: Cristian Ahumada present\u00f3 su charla de Tesis I de mag\u00edster titulada: \"Dise\u00f1o y desarrollo de una infraestructura computacional b\u00e1sica para el aprendizaje del Mapuzugun\".( slides ) 12/08/2020: Javier Mu\u00f1oz present\u00f3 su charla de Tesis I de mag\u00edster sobre multi-instance multi-label text classification para educaci\u00f3n especial. 05/08/2020: Frank Zamora practiced for his PhD qualification exam. He presented his work on Semantic Change Detection and his survey on word representations. 20/05/2020: Gonzalo Mena nos habl\u00f3 sobre \"M\u00e9todos de estad\u00edstica computacional y machine learning para las ciencias de la vida, con una aplicaci\u00f3n a COVID-19.\" ( slides ). 04/03/2020: Carlos Castillo ( Chato ) nos habl\u00f3 sobre \"Fairness and Transparency in Rankings\" ( slides ). 16/03/2019: Jos\u00e9 Lezama de la Universidad de la Rep\u00fablica in Uruguay nos present\u00f3 su trabajo publicado en ICLR titulado: Revisiting non-linear PCA with progressively grown autoencoders. 15/03/2019: Daniel Diomedi nos habl\u00f3 sobre su tema de tesis de mag\u00edster: Improving Question Answering Systems over Wikidata. 27/11/2019: Andr\u00e9s Abeliuk (University of Southern California), nos habl\u00f3 sobre el impacto de los algoritmos en la sociedad. M\u00e1s info . 16/10/2019: Rollan Rodr\u00edguez nos habl\u00f3 sobre m\u00e9todos de clasificaci\u00f3n usando topolog\u00eda. 09/10/2019: Felipe Gonz\u00e1lez (alumno de la USM) nos present\u00f3 su trabajo sobre privacidad en el caso de Cambridge Analytica en Twitter. Su trabajo hace uso de word embeddings y open coding para encontrar asociaciones entre t\u00e9rminos. 02/10/2019: Jorge nos habl\u00f3 sobre dos papers de la familia de BERT que est\u00e1n en revisi\u00f3n en ICLR: 1) ELECTRA y 2) ALBERT . Idea interesante de ELECTRA: tener dos redes adversariales donde la primera genera oraciones corrompidas pero altamente probables (se reemplazan ciertas palabras por un muestreo de la salida de una softmax). Esto reemplaza la idea de hacer masking en BERT. La segunda red recibe las oraciones corrompidas de la primera y aprende a discriminar las palabras originales de las falsas (esto se hace con un sigmoide). Idea interesante de ALBERT: usar un embedding layer de menor dimensionalidad que se aumenta luego con una capa de proyecci\u00f3n. Esto reduce el n\u00famero de par\u00e1metros respecto a BERT. Adem\u00e1s se propone reemplazar la task de next sentence prediction por una que tome dos oraciones consecutivas, las desordene en algunos casos, y prediga si tienen el orden correcto. El argumento es que la tarea de next sentence prediction de BERT (que pone pares de oraciones aleatorias en los ejemplos negativos) es un muy simple. 25/09/2019: Wladmir Cardoso Brand\u00e3o present\u00f3 InferSent , una t\u00e9cnica para entrenar sentence embeddings usando datos de la Natural Language Inference task. 11/09/2019: Henry Rosales present\u00f3 su art\u00edculo publicado en EMNLP sobre Entity Linking. 04/09/2019: vimos la segunda parte del video de MultiTask Learning. Algunos conceptos interesantes: pointer networks (capas basadas en atenci\u00f3n para copiar partes del input), anti-curriculum training (aprender primero lo m\u00e1s d\u00edficil para evitar quedar en \u00f3ptimo local). 28/08/2019: Jorge di\u00f3 una clase sobre XLNet . Para llegar a XLNet hizo un repaso sobre Attention, Transformer y BERT . Cosas destacables sobre XLNet: relative positional encoding y permutation language models. Un blog post que trata de digerir esto aqu\u00ed . 21/08/2019: Daniel Aguirre present\u00f3 su charla de tesis I de mag\u00edster sobre Transformers para resolver tareas algor\u00edtmicas. 14/08/2019: Vimos este video sobre MultiTask learning de Richard Socher. Alcanzamos a ver la primera mitad. Lo paramos varias veces para procesarlo. La idea es usar QA como una tarea global donde se pueden instanciar muchas tareas de NLP (e.g., translation, entailment, sentiment analysis). M\u00e1s info en http://decanlp.com/ . Quedamos en retomar el video m\u00e1s adelante y leer el paper con m\u00e1s profundidad. 07/08/2019: Pablo Badilla present\u00f3 su propuesta de Tesis de Mag\u00edster sobre bias en Word Embeddings.","title":"Seminars"},{"location":"seminars/#minutas-in-spanish","text":"02/08/2023 Ricardo Baeza-Yates present\u00f3 su seminario titulado: Inteligencia Artificial Responsable ( video ). 10/07/2023 Mircea Petrache present\u00f3 su seminario titulado: Conformal Language Modeling ( slides ). 07/05/2023 Edison Marrese-Taylor present\u00f3 su seminario titulado: Learning to Represent Edits ( slides ). 31/05/2023 Ciclo de charlas ChatGPT: Panel de Discusi\u00f3n - Alcances y l\u00edmites de los modelos de lenguaje. Panelitas: Cristi\u00e1n Buc (CENIA), slides mini-presentaci\u00f3n. Magdalena Salda\u00f1a (UC/IMFD). Mart\u00edn C\u00e1ceres (MINEDUC). Felipe Tobar (IDIA Uchile, CMM). Moderador: Claudio Guti\u00e9rrez (DCC-IMFD). 24/05/2023 Ciclo de charlas ChatGPT en la Industria: posibilidades y proyecciones ( video ): Jorge Per\u00e9z present\u00f3 su seminario: IA sin far\u00e1ndula ( slides ). Manuel Pe\u00f1a present\u00f3 su seminario: GPT y Agentes, Como Conversar con tu App ( slides ). 17/05/2023 Ciclo de Charlas de ChatGPT: Gabriela Arriagada present\u00f3 su seminario, Desaf\u00edos \u00e9ticos actuales a la luz de la revoluci\u00f3n sociotecnol\u00f3gica del GPT3 y 4 ( slides )( video ). 10/05/2023 Ciclo de Charlas ChatGPT: Felipe Bravo present\u00f3 su seminario titulado, Un recorrido por los Modelos de Lenguaje: desde Shannon a GPT-4 ( slides )( video ). 04/05/2023 Ciclo de Charlas ChatGPT: Jorge Ortiz present\u00f3 su seminario titulado, \u00bfPuede ChatGPT conquistar el mundo? Lenguaje humano vs lenguaje de m\u00e1quina ( slides )( video ). 26/04/2023 Mauricio Araneda present\u00f3 su seminario titulado: MUSIB: Musical Score Inpainting Benchmark ( slides ). 19/04/2023 Felipe Urrutia present\u00f3 su seminario titulado: The Role of Natural Language Processing in Advancing Competency-Based Education and Mathematics Learning in Fourth Graders ( slides ) 12/04/2023 Gabriel Iturra present\u00f3 su charla de tesis II titulada: RiverText: A Framework for Training and Evaluating Incremental Word Embeddings from Text Data Streams ( slides )( v\u00eddeo ). 05/04/2023 Valentin Barriere present\u00f3 su seminario titulada: Multilingual Multi-target Stance Recognition in Online Public Consultations ( slides ) 29/03/2023 Jos\u00e9 Ca\u00f1ete present\u00f3 su charla de tesis II titulada: Light and Fast Language Models for Spanish Through Compression Techniques ( slides )( video ). 25/01/2023 Valentin Barriere present\u00f3 su seminario titulado: Two improvements for mutli-lingual in-context classification over tweets using transformers ( slides ). 18/01/2023 Presentaciones rel\u00e1mpago de los miembros de Relela ( slides ). 11/01/2023 Mircea Petrache present\u00f3 su seminario titulada: Word embeddings analogies and paraphrases: proofs and open problems ( slides ). 04/01/2023 Se realizo una reuni\u00f3n de coordinaci\u00f3n para futuras actividades Relela, donde se tomaron los siguientes acuerdos: Evento con presentaciones rel\u00e1mpagos sobre el tema que cada uno trabaja (2 minutos de presentaci\u00f3n con 1 diapositiva). Profesores de ReLeLa incorporar\u00e1n a sus estudiantes. Presentaci\u00f3n periodica de papers (semanal). Definir roles en el grupo. 21/12/2022 Se presentaron 2 charlas de Tesis I de mag\u00edster, 1) Clemente Henr\u00edquez: Evolution of topic and issues in Chilean news ( slides ), 2) Ignacio Meza: Benchmarking video action features for the video temporary sentence grounding task ( slides ). 14/12/2022 Jorge Ortiz present\u00f3 su charla de Tesis I de mag\u00edster titulada: \"Attitude Analysis: a linguistic-based task for detailed position detection in texts\" ( slides ). 07/12/2022 Mar\u00eda Jos\u00e9 Zambrano present\u00f3 su charla de Tesis I de mag\u00edster titulada: \"Comparison and Improvement of Bias Mitigation Algorithms for Word Embeddings\" ( slides ). 22/07/2022 Mauricio Araneda present\u00f3 su charla de Tesis II de mag\u00edster titulada: \"Computers making music? Measuring current progress with MUSIB evaluation\" ( slides ). 13/07/2022 Se presentaron 3 charlas de Tesis I de mag\u00edster, 1) Jos\u00e9 Espina: Marco de trabajo de calibraci\u00f3n r\u00e1pida de confianza, en toma de decisiones asistidas por IA, 2) Alfonso Valderrama : Entrop\u00eda de Shannon como medida de predictibilidad de sistemas de recomendaci\u00f3n, 3)Ignacio Nu\u00f1ez: Defining an extensible architecture for a multi-task GUI-oriented Machine Learning software. 22/06/2022 Juan Pablo Silva present\u00f3 su charla de Tesis II de mag\u00edster titulada: \"Logic-based interpretability of Graph Neural Networks\" 28/04/2022 Miguel Cordero del Servicio de Salud Metropolitano Sur Oriente de Santiago de Chile, nos present\u00f3 \"Tendencias de la salud mental en los primeros 20 a\u00f1os de vida de usuarios/as de servicios de salud en el sur oriente de Santiago: \u00bfqu\u00e9 podemos aprender de las notas medicas?\" 05/01/2022 Rolando Kindelan nos di\u00f3 una charla titulado \"An\u00e1lisis Topol\u00f3gico de Datos (TDA): antecedentes, actualidad y perspectivas\" 22/12/2021 El alumno de mag\u00edster Jos\u00e9 Ca\u00f1ete present\u00f3 su charla de tesis I: \"Efficient models for Spanish NLP through Knowledge Distillation\" ( slides )( video ) 15/12/2021 El alumno de mag\u00edster Mat\u00edas Rojas present\u00f3 su charla de tesis II titulada: Nested named entity recognition in diagnoses from the Chilean Waiting List in public hospitals ( slides ) 01/12/2021 Los alumnos de mag\u00edster Humberto Rodrigues y David Rojas presentaron sus charlas de Tesis I tituladas \"Exploring bias metric strategies in contextualized embeddings\" y \"Word Embedding Bias Origin Detection\". 19/11/2021 Javier Mu\u00f1oz present\u00f3 su trabajo de tesis de mag\u00edster: \"Aprendizaje multi-instancia multi-etiqueta en la recomendaci\u00f3n de intervenciones\" 29/09/2021 Cristian Ahumada present\u00f3 su trabajo: \"Dise\u00f1o y desarrollo de un software de apoyo para el aprendizaje del Mapuzugun\" 22/09/2021 Mauricio Araneda present\u00f3 un tutorial sobre VAEs. ( slides ) 01/09/2021 Pablo Badilla nos habl\u00f3 sobre su trabajo en el proyecto \"lxs 400 \" 07/07/2021 Los alumnos de mag\u00edster Basti\u00e1n Matamala, Mauricio Araneda y Gabriel Iturra presentaron sus charlas de Tesis I. 05/05/2021 Carolina Chiu habl\u00f3 sobre el testeo de word embeddings en el contexto cl\u00ednico. 21/04/2021 Cristi\u00e1n Candia (UDD) nos habl\u00f3 sobre su trabajo en \"Inteligencia Colectiva\". 14/04/2021 Gast\u00f3n L'huillier nos habl\u00f3 sobre Machine Learning Engineering, infraestructura y todos los desaf\u00edos de poner en modelos en producci\u00f3n. ( slides ) 24/03/2021 Andr\u00e9s Abeliuk present\u00f3 su l\u00ednea de investigaci\u00f3n en tema de polarizaci\u00f3n. 17/03/2021 Alan Ansell present\u00f3 su trabajo sobre PolyLM, un LM pol\u00edsemico ( video ) 29/01/2021 Felipe Bravo dio un tutorial introductorio a la inferencia Bayesiana. 20/01/2021 Daniel Diomedi present\u00f3 su charla de Tesis II sobre Question Answering sobre Wikidata usando Entity Linking and Neural Semantic Parsing. 13/01/2021 Javier Vera present\u00f3 su trabajo sobre Aproximaciones computacionales a la diversidad ling\u00fc\u00edstica de Sudam\u00e9rica (la charla fue grabada). 06/01/2021 Pablo Badilla present\u00f3 su trabajo sobre sesgo en word embeddings. 23/12/2020 Bernardo Subercaseaux nos habl\u00f3 de su trabajo de investigaci\u00f3n acerca de formalizaciones de interpretabilidad de modelos de aprendizaje autom\u00e1tico desde el punto de vista de la complejidad computacional (slides, video ) 17/12/2020 Jorge Ortiz nos habl\u00f3 sobre la ling\u00fc\u00edstica s\u00edstemico funcional y sus potenciales v\u00ednculos con NLP. ( slides , video ) 02/12/2020: Mat\u00edas Rojas present\u00f3 su charla de Tesis I de mag\u00edster sobre nested NER en el Chilean Waiting List Corpus. 11/11/2020: Cristi\u00e1n Tamblay present\u00f3 su trabajo de memoria sobre transferencia de modelos de sentimiento y emoci\u00f3n en distintos dominios. 23/09/2020: Hern\u00e1n Sarmiento practic\u00f3 su charla de propuesta de tesis doctoral titulada: \"A Domain-independent and Multilingual Approach for Crisis Event Detection and Understanding\" 09/09/2020: Cristian Ahumada present\u00f3 su charla de Tesis I de mag\u00edster titulada: \"Dise\u00f1o y desarrollo de una infraestructura computacional b\u00e1sica para el aprendizaje del Mapuzugun\".( slides ) 12/08/2020: Javier Mu\u00f1oz present\u00f3 su charla de Tesis I de mag\u00edster sobre multi-instance multi-label text classification para educaci\u00f3n especial. 05/08/2020: Frank Zamora practiced for his PhD qualification exam. He presented his work on Semantic Change Detection and his survey on word representations. 20/05/2020: Gonzalo Mena nos habl\u00f3 sobre \"M\u00e9todos de estad\u00edstica computacional y machine learning para las ciencias de la vida, con una aplicaci\u00f3n a COVID-19.\" ( slides ). 04/03/2020: Carlos Castillo ( Chato ) nos habl\u00f3 sobre \"Fairness and Transparency in Rankings\" ( slides ). 16/03/2019: Jos\u00e9 Lezama de la Universidad de la Rep\u00fablica in Uruguay nos present\u00f3 su trabajo publicado en ICLR titulado: Revisiting non-linear PCA with progressively grown autoencoders. 15/03/2019: Daniel Diomedi nos habl\u00f3 sobre su tema de tesis de mag\u00edster: Improving Question Answering Systems over Wikidata. 27/11/2019: Andr\u00e9s Abeliuk (University of Southern California), nos habl\u00f3 sobre el impacto de los algoritmos en la sociedad. M\u00e1s info . 16/10/2019: Rollan Rodr\u00edguez nos habl\u00f3 sobre m\u00e9todos de clasificaci\u00f3n usando topolog\u00eda. 09/10/2019: Felipe Gonz\u00e1lez (alumno de la USM) nos present\u00f3 su trabajo sobre privacidad en el caso de Cambridge Analytica en Twitter. Su trabajo hace uso de word embeddings y open coding para encontrar asociaciones entre t\u00e9rminos. 02/10/2019: Jorge nos habl\u00f3 sobre dos papers de la familia de BERT que est\u00e1n en revisi\u00f3n en ICLR: 1) ELECTRA y 2) ALBERT . Idea interesante de ELECTRA: tener dos redes adversariales donde la primera genera oraciones corrompidas pero altamente probables (se reemplazan ciertas palabras por un muestreo de la salida de una softmax). Esto reemplaza la idea de hacer masking en BERT. La segunda red recibe las oraciones corrompidas de la primera y aprende a discriminar las palabras originales de las falsas (esto se hace con un sigmoide). Idea interesante de ALBERT: usar un embedding layer de menor dimensionalidad que se aumenta luego con una capa de proyecci\u00f3n. Esto reduce el n\u00famero de par\u00e1metros respecto a BERT. Adem\u00e1s se propone reemplazar la task de next sentence prediction por una que tome dos oraciones consecutivas, las desordene en algunos casos, y prediga si tienen el orden correcto. El argumento es que la tarea de next sentence prediction de BERT (que pone pares de oraciones aleatorias en los ejemplos negativos) es un muy simple. 25/09/2019: Wladmir Cardoso Brand\u00e3o present\u00f3 InferSent , una t\u00e9cnica para entrenar sentence embeddings usando datos de la Natural Language Inference task. 11/09/2019: Henry Rosales present\u00f3 su art\u00edculo publicado en EMNLP sobre Entity Linking. 04/09/2019: vimos la segunda parte del video de MultiTask Learning. Algunos conceptos interesantes: pointer networks (capas basadas en atenci\u00f3n para copiar partes del input), anti-curriculum training (aprender primero lo m\u00e1s d\u00edficil para evitar quedar en \u00f3ptimo local). 28/08/2019: Jorge di\u00f3 una clase sobre XLNet . Para llegar a XLNet hizo un repaso sobre Attention, Transformer y BERT . Cosas destacables sobre XLNet: relative positional encoding y permutation language models. Un blog post que trata de digerir esto aqu\u00ed . 21/08/2019: Daniel Aguirre present\u00f3 su charla de tesis I de mag\u00edster sobre Transformers para resolver tareas algor\u00edtmicas. 14/08/2019: Vimos este video sobre MultiTask learning de Richard Socher. Alcanzamos a ver la primera mitad. Lo paramos varias veces para procesarlo. La idea es usar QA como una tarea global donde se pueden instanciar muchas tareas de NLP (e.g., translation, entailment, sentiment analysis). M\u00e1s info en http://decanlp.com/ . Quedamos en retomar el video m\u00e1s adelante y leer el paper con m\u00e1s profundidad. 07/08/2019: Pablo Badilla present\u00f3 su propuesta de Tesis de Mag\u00edster sobre bias en Word Embeddings.","title":"Minutas (In Spanish)"}]} \ No newline at end of file +{"config":{"indexing":"full","lang":["en"],"min_search_length":3,"prebuild_index":false,"separator":"[\\s\\-]+"},"docs":[{"location":"","text":"The Representations for Learning and Language (ReLeLa) research group located within the Department of Computer Science (DCC) at the University of Chile studies the fields of representation learning and natural language processing, as well as other topics related to data science and artificial intelligence. Members Academic Staff Andr\u00e9s Abeliuk Ricardo Baeza-Yates Felipe Bravo-Marquez Benjam\u00edn Bustos Jocelyn Dunstan Eduardo Graells-Garrido Claudio Guti\u00e9rrez Aidan Hogan Jorge P\u00e9rez B\u00e1rbara Poblete Iv\u00e1n Sipir\u00e1n Jorge Silva Students PhD Students Aym\u00e9 Arango Rolando Kindelan Jesus Perez-Martin Frank Zamora Cinthia S\u00e1nchez Fabi\u00e1n Villena Masters Students Daniel Aguirre Juan-Pablo Silva Jorge Ortiz Basti\u00e1n Matamala Mauricio Araneda Gabriel Chaper\u00f3n Ignacio Meza Mar\u00eda Jos\u00e9 Zambrano Humberto Rodrigues David Rojas Ignacio N\u00fa\u00f1ez Sebasti\u00e1n Tinoco Felipe Urrutia Victor Faraggi Undergrad Students Monserrat Prado Juan Andr\u00e9s Moreno Sebasti\u00e1n Donoso Maximiliano Aguilar Rodrigo Urrea Alumni Gabriel Iturra-Bocaz Jos\u00e9 Ca\u00f1ete Juglar D\u00edaz Hern\u00e1n Sarmiento Mat\u00edas Rojas Cristi\u00e1n Ahumada Constanza Fierro Daniel Diomedi Pablo Badilla Cristi\u00e1n Tamblay Henry Rosales Camilo Garrido Vicente Oyanedel Ricardo C\u00f3rdova Collaborators Mircea Petrache Valentin Barriere Cristian Rodriguez Edison Marrese-Taylor Mauricio Quezada Felipe Tobar Jos\u00e9 Manuel Saavedra Juan Manuel Barrios Mauricio Cerda Alexandre Bergel Projects Spanish Word Embeddings AffectiveTweets BETO: Spanish BERT WEFE: The Word Embeddings Fairness Evaluation Framework ALBETO and DistilBETO: Lightweight Spanish Language Models RiverText: An Python Library for Training and Evaluating Incremental Word Embeddings Courses Deep Learning Natural Language Processing Data Mining Statistical Thinking Network Members of our group participate or interact with the following other research groups, centers or companies: National Center for Artificial Intelligence Research (CENIA) Millennium Institute for Foundational Research on Data CERO.AI Natural Language Processing @ CMM The Laboratory of Scientific Image Analysis (SCIAN-Lab) Grupo de Aprendizaje de M\u00e1quinas, infErencia y Se\u00f1ales (GAMES) Machine Learning Group - University of Waikato Impresee eCommerce Labs","title":"Home"},{"location":"#members","text":"","title":"Members"},{"location":"#academic-staff","text":"Andr\u00e9s Abeliuk Ricardo Baeza-Yates Felipe Bravo-Marquez Benjam\u00edn Bustos Jocelyn Dunstan Eduardo Graells-Garrido Claudio Guti\u00e9rrez Aidan Hogan Jorge P\u00e9rez B\u00e1rbara Poblete Iv\u00e1n Sipir\u00e1n Jorge Silva","title":"Academic Staff"},{"location":"#students","text":"","title":"Students"},{"location":"#phd-students","text":"Aym\u00e9 Arango Rolando Kindelan Jesus Perez-Martin Frank Zamora Cinthia S\u00e1nchez Fabi\u00e1n Villena","title":"PhD Students"},{"location":"#masters-students","text":"Daniel Aguirre Juan-Pablo Silva Jorge Ortiz Basti\u00e1n Matamala Mauricio Araneda Gabriel Chaper\u00f3n Ignacio Meza Mar\u00eda Jos\u00e9 Zambrano Humberto Rodrigues David Rojas Ignacio N\u00fa\u00f1ez Sebasti\u00e1n Tinoco Felipe Urrutia Victor Faraggi","title":"Masters Students"},{"location":"#undergrad-students","text":"Monserrat Prado Juan Andr\u00e9s Moreno Sebasti\u00e1n Donoso Maximiliano Aguilar Rodrigo Urrea","title":"Undergrad Students"},{"location":"#alumni","text":"Gabriel Iturra-Bocaz Jos\u00e9 Ca\u00f1ete Juglar D\u00edaz Hern\u00e1n Sarmiento Mat\u00edas Rojas Cristi\u00e1n Ahumada Constanza Fierro Daniel Diomedi Pablo Badilla Cristi\u00e1n Tamblay Henry Rosales Camilo Garrido Vicente Oyanedel Ricardo C\u00f3rdova","title":"Alumni"},{"location":"#collaborators","text":"Mircea Petrache Valentin Barriere Cristian Rodriguez Edison Marrese-Taylor Mauricio Quezada Felipe Tobar Jos\u00e9 Manuel Saavedra Juan Manuel Barrios Mauricio Cerda Alexandre Bergel","title":"Collaborators"},{"location":"#projects","text":"Spanish Word Embeddings AffectiveTweets BETO: Spanish BERT WEFE: The Word Embeddings Fairness Evaluation Framework ALBETO and DistilBETO: Lightweight Spanish Language Models RiverText: An Python Library for Training and Evaluating Incremental Word Embeddings","title":"Projects"},{"location":"#courses","text":"Deep Learning Natural Language Processing Data Mining Statistical Thinking","title":"Courses"},{"location":"#network","text":"Members of our group participate or interact with the following other research groups, centers or companies: National Center for Artificial Intelligence Research (CENIA) Millennium Institute for Foundational Research on Data CERO.AI Natural Language Processing @ CMM The Laboratory of Scientific Image Analysis (SCIAN-Lab) Grupo de Aprendizaje de M\u00e1quinas, infErencia y Se\u00f1ales (GAMES) Machine Learning Group - University of Waikato Impresee eCommerce Labs","title":"Network"},{"location":"ciclos/","text":"Ciclos de Charlas ReLeLa Las (im)posibilidades de los Modelos del Lenguaje Lugar: Auditorio Ram\u00f3n Picarte, DCC UCHILE. Direcci\u00f3n: Avenida Beauchef 851, Tercer Piso, Edificio Norte, Santiago. Organizaci\u00f3n: RELELA , DCC Uchile . Patrocinadores: CENIA , IMFD . Ser\u00e1 en formato h\u00edbrido y se transmitir\u00e1 a trav\u00e9s del canal de Youtube del DCC . Inscripciones Sobre el evento La creciente importancia y la masividad que han adquirido recientemente los modelos de lenguaje como ChatGPT ha generado en la ciudadan\u00eda preocupaciones sobre sus condiciones de posibilidad y sus limitaciones. Debido a la naturaleza multidisciplinaria de la problem\u00e1tica, se requiere crear espacios de di\u00e1logo, difusi\u00f3n y la colaboraci\u00f3n entre expertos de diferentes \u00e1reas. El objetivo de este ciclo es brindar una visi\u00f3n amplia y cr\u00edtica sobre el desarrollo y las posibilidades de los modelos de lenguaje, espec\u00edficamente en relaci\u00f3n a los \u00faltimos avances tecnol\u00f3gicos en el campo de la inteligencia artificial. Se busca explicar los fundamentos t\u00e9cnicos de estas tecnolog\u00edas y fomentar la reflexi\u00f3n y el debate sobre el papel que juegan estos modelos en la sociedad actual, sus limitaciones y posibles riesgos, y las implicaciones \u00e9ticas y sociales que plantean. Cronograma Mi\u00e9rcoles 3 de mayo 4PM Presentador: Presentador: Jorge Ortiz DCC Uchile, IMFD, Awto. T\u00edtulo: \u00bfPuede ChatGPT conquistar el mundo? Lenguaje humano vs lenguaje de m\u00e1quina ( slides , grabaci\u00f3n ). Mi\u00e9rcoles 10 de mayo 4PM Presentador: Felipe Bravo-M\u00e1rquez DCC Uchile, IMFD, CENIA. T\u00edtulo: Un recorrido por los Modelos de Lenguaje: desde Shannon a GPT-4 ( slides , grabaci\u00f3n ). Mi\u00e9rcoles 17 de mayo 4PM Presentadora: Gabriela Arriagada, IEA, IMC, UC, CENIA. T\u00edtulo: Desaf\u00edos \u00e9ticos actuales a la luz de la revoluci\u00f3n sociotecnol\u00f3gica del GPT3 y 4 ( slides , grabaci\u00f3n ). Mi\u00e9rcoles 24 de mayo 4PM T\u00edtulo: ChatGPT en la Industria: posibilidades y proyecciones , ( grabaci\u00f3n ). Charla 1: \"IA sin far\u00e1ndula\" por Jorge P\u00e9rez (CERO) ( slides ). Charla 2: \"GPT y Agentes, Como Conversar con tu App\" por Manuel Pe\u00f1a (Fintual) ( slides ). Mi\u00e9rcoles 31 de mayo 4PM T\u00edtulo: Panel de Discusi\u00f3n - Alcances y l\u00edmites de los modelos de lenguaje ( grabaci\u00f3n ). Panelistas: Cristi\u00e1n Buc (CENIA), Magdalena Salda\u00f1a (UC/IMFD), Mart\u00edn C\u00e1ceres (MINEDUC) y Felipe Tobar (IDIA Uchile, CMM). slides mini-presentaci\u00f3n de Cristi\u00e1n Buc. Moderador: Claudio Guti\u00e9rrez (DCC Uchile, IMFD). Expositores Felipe Bravo-M\u00e1rquez Profesor asistente en el Departamento de Ciencias de la Computaci\u00f3n de la Universidad de Chile, Investigador Asociado del Centro Nacional de Inteligencia Artificial (CENIA) e Investigador Joven del Instituto Milenio Fundamento de los Datos (IMFD). Realiz\u00f3 su doctorado en el grupo Machine Learning de la Universidad de Waikato, Nueva Zelanda, donde tambi\u00e9n trabaj\u00f3 como Research Fellow durante dos a\u00f1os. Sus intereses de investigaci\u00f3n abarcan las \u00e1reas del procesamiento del lenguaje natural (NLP), el aprendizaje autom\u00e1tico (ML), la inteligencia artificial (AI) y la recuperaci\u00f3n de informaci\u00f3n (IR). Jorge Ortiz Fuentes Data Scientist y Ling\u00fcista. Licenciado en Letras Hisp\u00e1nicas de la Pontificia Universidad Cat\u00f3lica, Mag\u00edster (c) en Ciencias de la Computaci\u00f3n de la Universidad de Chile y Estudiante IMFD . Sus \u00e1reas de investigaci\u00f3n y desarrollo abarcan el procesamiento de Lenguaje Natural, la Ciencia de Datos y la Ling\u00fc\u00edstica. Actualmente se desempe\u00f1a como Machine Learning Engineer en Awto. Gabriela Arriagada Profesora Asistente, Instituto de \u00c9tica Aplicada (IEA) & Instituto de Ingenier\u00eda Matem\u00e1tica y Computacional (IMC), UC, Investigadora CENIA. Candidata a Doctor en Filosof\u00eda y \u00c9tica Aplicada de la Universidad de Leeds, Inglaterra . La mayor parte de su trabajo se centra en la \u00e9tica aplicada. Actualmente investiga sobre sesgo, equidad y explicabilidad en IA y ciencia de datos. Jorge Per\u00e9z Co-Fundador de Cero.ai. Cero.ai es una empresa que apoya a que los pacientes lleguen a sus citas a la hora y preparados. Actualmente dirige el desarrollo en inteligencia artificial del producto, y est\u00e1 a cargo de las ventas a instituciones p\u00fablicas de salud. Antes de cero.ai fue acad\u00e9mico e investigador universitario por m\u00e1s de 15 a\u00f1os (DCC Uchile) y estudi\u00f3 un PhD en Computaci\u00f3n (UC). Su \u00e1rea principal de investigaci\u00f3n es el Procesamiento de Lenguaje Natural y Redes Neuronales Profundas. Jos\u00e9 Manuel Pe\u00f1a Senior Portfolio Manager en Fintual, Ingeniero Civil Industrial de la Universidad de Chile, Chartered Financial Analyst (CFA) y Master en Applied Analytics de la Universidad de Columbia en Nueva York . Ha ejercido cargos en la industria financiera en \u00e1reas de an\u00e1lisis, desarrollo y gesti\u00f3n de portafolios para clientes privados y fondos de pensiones, adem\u00e1s de haber realizado emprendimientos en \u00e1reas de analytics e inteligencia artificial. Manu tambi\u00e9n es Regional Chair del Columbia SPS Career Coalition y miembro de la comisi\u00f3n de Inteligencia Artificial y Big Data del Instituto de Ingenieros de Chile. Cristi\u00e1n Buc Investigador CENIA: Jefe del grupo cient\u00edfico @ CENIA. PhD en Neurociencias Computacionales Cognitivas de la Universidad Libre de Bruselas, postdoctorados en Ghent University y Brown University . Su \u00e1rea de investigaci\u00f3n emerge de la intersecci\u00f3n entre Neurociencias e IA. En particular, su trabajo se centra en el desarrollo de redes neuronales inspiradas en funciones y mecanismos cerebrales. Magdalena Salda\u00f1a Profesora Asistente de la Facultad de Comunicaciones de la Pontificia Universidad Cat\u00f3lica de Chile e investigadora del Instituto Milenio Fundamento de los Datos. Doctora en Periodismo y Comunicaci\u00f3n de Masas, University of Texas- Austin (Estados Unidos). Mag\u00edster en Investigaci\u00f3n Social y Desarrollo, Universidad de Concepci\u00f3n. Periodista, Universidad de Concepci\u00f3n. Sus \u00e1reas de investigaci\u00f3n son: Medios digitales, comunicaci\u00f3n pol\u00edtica, opini\u00f3n p\u00fablica y estudios latinoamericanos. Felipe Tobar Profesor Asociado, Universidad de Chile, Director, Iniciativa de Datos e Inteligencia Artificial, Uchile, Investigador, CMM & AC3E. Su investigaci\u00f3n se sit\u00faa entre el Aprendizaje Autom\u00e1tico Estad\u00edstico y el Procesamiento de Se\u00f1ales, incluyendo inferencia aproximada, inferencia no-param\u00e9trica bayesiana, estimaci\u00f3n espectral y transporte \u00f3ptimo computacional. Mart\u00edn C\u00e1ceres Director del Centro de Innovaci\u00f3n MINEDUC. Licenciado en F\u00edsica y Doctor en Ciencias de la Ingenier\u00eda de la Pontificia Universidad Cat\u00f3lica de Chile. Ha trabajado como docente en el sistema escolar ense\u00f1ando f\u00edsica, electr\u00f3nica y rob\u00f3tica, y en el sistema universitario ha dictado cursos de humanidades digitales y metodolog\u00edas innovadoras de ense\u00f1anza y aprendizaje. Adem\u00e1s, ha trabajado en asesor\u00edas a escuelas y universidades y en pol\u00edtica p\u00fablica relacionada con innovaci\u00f3n pedag\u00f3gica en Chile y en el extranjero. Afiches \u00bfPuede ChatGPT conquistar el mundo? Lenguaje humano vs lenguaje de m\u00e1quina. Un recorrido por los Modelos de Lenguaje: desde Shannon a GPT-4. Desaf\u00edos \u00e9ticos actuales a la luz de la revoluci\u00f3n sociotecnol\u00f3gica del GPT3 y 4. ChatGPT en la Industria: posibilidades y proyecciones. Alcances y l\u00edmites de los modelos de lenguaje.","title":"Ciclos de Charlas"},{"location":"ciclos/#ciclos-de-charlas-relela","text":"","title":"Ciclos de Charlas ReLeLa"},{"location":"ciclos/#las-imposibilidades-de-los-modelos-del-lenguaje","text":"Lugar: Auditorio Ram\u00f3n Picarte, DCC UCHILE. Direcci\u00f3n: Avenida Beauchef 851, Tercer Piso, Edificio Norte, Santiago. Organizaci\u00f3n: RELELA , DCC Uchile . Patrocinadores: CENIA , IMFD . Ser\u00e1 en formato h\u00edbrido y se transmitir\u00e1 a trav\u00e9s del canal de Youtube del DCC .","title":"Las (im)posibilidades de los Modelos del Lenguaje"},{"location":"ciclos/#inscripciones","text":"","title":"Inscripciones"},{"location":"ciclos/#sobre-el-evento","text":"La creciente importancia y la masividad que han adquirido recientemente los modelos de lenguaje como ChatGPT ha generado en la ciudadan\u00eda preocupaciones sobre sus condiciones de posibilidad y sus limitaciones. Debido a la naturaleza multidisciplinaria de la problem\u00e1tica, se requiere crear espacios de di\u00e1logo, difusi\u00f3n y la colaboraci\u00f3n entre expertos de diferentes \u00e1reas. El objetivo de este ciclo es brindar una visi\u00f3n amplia y cr\u00edtica sobre el desarrollo y las posibilidades de los modelos de lenguaje, espec\u00edficamente en relaci\u00f3n a los \u00faltimos avances tecnol\u00f3gicos en el campo de la inteligencia artificial. Se busca explicar los fundamentos t\u00e9cnicos de estas tecnolog\u00edas y fomentar la reflexi\u00f3n y el debate sobre el papel que juegan estos modelos en la sociedad actual, sus limitaciones y posibles riesgos, y las implicaciones \u00e9ticas y sociales que plantean.","title":"Sobre el evento"},{"location":"ciclos/#cronograma","text":"Mi\u00e9rcoles 3 de mayo 4PM Presentador: Presentador: Jorge Ortiz DCC Uchile, IMFD, Awto. T\u00edtulo: \u00bfPuede ChatGPT conquistar el mundo? Lenguaje humano vs lenguaje de m\u00e1quina ( slides , grabaci\u00f3n ). Mi\u00e9rcoles 10 de mayo 4PM Presentador: Felipe Bravo-M\u00e1rquez DCC Uchile, IMFD, CENIA. T\u00edtulo: Un recorrido por los Modelos de Lenguaje: desde Shannon a GPT-4 ( slides , grabaci\u00f3n ). Mi\u00e9rcoles 17 de mayo 4PM Presentadora: Gabriela Arriagada, IEA, IMC, UC, CENIA. T\u00edtulo: Desaf\u00edos \u00e9ticos actuales a la luz de la revoluci\u00f3n sociotecnol\u00f3gica del GPT3 y 4 ( slides , grabaci\u00f3n ). Mi\u00e9rcoles 24 de mayo 4PM T\u00edtulo: ChatGPT en la Industria: posibilidades y proyecciones , ( grabaci\u00f3n ). Charla 1: \"IA sin far\u00e1ndula\" por Jorge P\u00e9rez (CERO) ( slides ). Charla 2: \"GPT y Agentes, Como Conversar con tu App\" por Manuel Pe\u00f1a (Fintual) ( slides ). Mi\u00e9rcoles 31 de mayo 4PM T\u00edtulo: Panel de Discusi\u00f3n - Alcances y l\u00edmites de los modelos de lenguaje ( grabaci\u00f3n ). Panelistas: Cristi\u00e1n Buc (CENIA), Magdalena Salda\u00f1a (UC/IMFD), Mart\u00edn C\u00e1ceres (MINEDUC) y Felipe Tobar (IDIA Uchile, CMM). slides mini-presentaci\u00f3n de Cristi\u00e1n Buc. Moderador: Claudio Guti\u00e9rrez (DCC Uchile, IMFD).","title":"Cronograma"},{"location":"ciclos/#expositores","text":"","title":"Expositores"},{"location":"ciclos/#felipe-bravo-marquez","text":"Profesor asistente en el Departamento de Ciencias de la Computaci\u00f3n de la Universidad de Chile, Investigador Asociado del Centro Nacional de Inteligencia Artificial (CENIA) e Investigador Joven del Instituto Milenio Fundamento de los Datos (IMFD). Realiz\u00f3 su doctorado en el grupo Machine Learning de la Universidad de Waikato, Nueva Zelanda, donde tambi\u00e9n trabaj\u00f3 como Research Fellow durante dos a\u00f1os. Sus intereses de investigaci\u00f3n abarcan las \u00e1reas del procesamiento del lenguaje natural (NLP), el aprendizaje autom\u00e1tico (ML), la inteligencia artificial (AI) y la recuperaci\u00f3n de informaci\u00f3n (IR).","title":"Felipe Bravo-M\u00e1rquez"},{"location":"ciclos/#jorge-ortiz-fuentes","text":"Data Scientist y Ling\u00fcista. Licenciado en Letras Hisp\u00e1nicas de la Pontificia Universidad Cat\u00f3lica, Mag\u00edster (c) en Ciencias de la Computaci\u00f3n de la Universidad de Chile y Estudiante IMFD . Sus \u00e1reas de investigaci\u00f3n y desarrollo abarcan el procesamiento de Lenguaje Natural, la Ciencia de Datos y la Ling\u00fc\u00edstica. Actualmente se desempe\u00f1a como Machine Learning Engineer en Awto.","title":"Jorge Ortiz Fuentes"},{"location":"ciclos/#gabriela-arriagada","text":"Profesora Asistente, Instituto de \u00c9tica Aplicada (IEA) & Instituto de Ingenier\u00eda Matem\u00e1tica y Computacional (IMC), UC, Investigadora CENIA. Candidata a Doctor en Filosof\u00eda y \u00c9tica Aplicada de la Universidad de Leeds, Inglaterra . La mayor parte de su trabajo se centra en la \u00e9tica aplicada. Actualmente investiga sobre sesgo, equidad y explicabilidad en IA y ciencia de datos.","title":"Gabriela Arriagada"},{"location":"ciclos/#jorge-perez","text":"Co-Fundador de Cero.ai. Cero.ai es una empresa que apoya a que los pacientes lleguen a sus citas a la hora y preparados. Actualmente dirige el desarrollo en inteligencia artificial del producto, y est\u00e1 a cargo de las ventas a instituciones p\u00fablicas de salud. Antes de cero.ai fue acad\u00e9mico e investigador universitario por m\u00e1s de 15 a\u00f1os (DCC Uchile) y estudi\u00f3 un PhD en Computaci\u00f3n (UC). Su \u00e1rea principal de investigaci\u00f3n es el Procesamiento de Lenguaje Natural y Redes Neuronales Profundas.","title":"Jorge Per\u00e9z"},{"location":"ciclos/#jose-manuel-pena","text":"Senior Portfolio Manager en Fintual, Ingeniero Civil Industrial de la Universidad de Chile, Chartered Financial Analyst (CFA) y Master en Applied Analytics de la Universidad de Columbia en Nueva York . Ha ejercido cargos en la industria financiera en \u00e1reas de an\u00e1lisis, desarrollo y gesti\u00f3n de portafolios para clientes privados y fondos de pensiones, adem\u00e1s de haber realizado emprendimientos en \u00e1reas de analytics e inteligencia artificial. Manu tambi\u00e9n es Regional Chair del Columbia SPS Career Coalition y miembro de la comisi\u00f3n de Inteligencia Artificial y Big Data del Instituto de Ingenieros de Chile.","title":"Jos\u00e9 Manuel Pe\u00f1a"},{"location":"ciclos/#cristian-buc","text":"Investigador CENIA: Jefe del grupo cient\u00edfico @ CENIA. PhD en Neurociencias Computacionales Cognitivas de la Universidad Libre de Bruselas, postdoctorados en Ghent University y Brown University . Su \u00e1rea de investigaci\u00f3n emerge de la intersecci\u00f3n entre Neurociencias e IA. En particular, su trabajo se centra en el desarrollo de redes neuronales inspiradas en funciones y mecanismos cerebrales.","title":"Cristi\u00e1n Buc"},{"location":"ciclos/#magdalena-saldana","text":"Profesora Asistente de la Facultad de Comunicaciones de la Pontificia Universidad Cat\u00f3lica de Chile e investigadora del Instituto Milenio Fundamento de los Datos. Doctora en Periodismo y Comunicaci\u00f3n de Masas, University of Texas- Austin (Estados Unidos). Mag\u00edster en Investigaci\u00f3n Social y Desarrollo, Universidad de Concepci\u00f3n. Periodista, Universidad de Concepci\u00f3n. Sus \u00e1reas de investigaci\u00f3n son: Medios digitales, comunicaci\u00f3n pol\u00edtica, opini\u00f3n p\u00fablica y estudios latinoamericanos.","title":"Magdalena Salda\u00f1a"},{"location":"ciclos/#felipe-tobar","text":"Profesor Asociado, Universidad de Chile, Director, Iniciativa de Datos e Inteligencia Artificial, Uchile, Investigador, CMM & AC3E. Su investigaci\u00f3n se sit\u00faa entre el Aprendizaje Autom\u00e1tico Estad\u00edstico y el Procesamiento de Se\u00f1ales, incluyendo inferencia aproximada, inferencia no-param\u00e9trica bayesiana, estimaci\u00f3n espectral y transporte \u00f3ptimo computacional.","title":"Felipe Tobar"},{"location":"ciclos/#martin-caceres","text":"Director del Centro de Innovaci\u00f3n MINEDUC. Licenciado en F\u00edsica y Doctor en Ciencias de la Ingenier\u00eda de la Pontificia Universidad Cat\u00f3lica de Chile. Ha trabajado como docente en el sistema escolar ense\u00f1ando f\u00edsica, electr\u00f3nica y rob\u00f3tica, y en el sistema universitario ha dictado cursos de humanidades digitales y metodolog\u00edas innovadoras de ense\u00f1anza y aprendizaje. Adem\u00e1s, ha trabajado en asesor\u00edas a escuelas y universidades y en pol\u00edtica p\u00fablica relacionada con innovaci\u00f3n pedag\u00f3gica en Chile y en el extranjero.","title":"Mart\u00edn C\u00e1ceres"},{"location":"ciclos/#afiches","text":"","title":"Afiches"},{"location":"ciclos/#puede-chatgpt-conquistar-el-mundo-lenguaje-humano-vs-lenguaje-de-maquina","text":"","title":"\u00bfPuede ChatGPT conquistar el mundo? Lenguaje humano vs lenguaje de m\u00e1quina."},{"location":"ciclos/#un-recorrido-por-los-modelos-de-lenguaje-desde-shannon-a-gpt-4","text":"","title":"Un recorrido por los Modelos de Lenguaje: desde Shannon a GPT-4."},{"location":"ciclos/#desafios-eticos-actuales-a-la-luz-de-la-revolucion-sociotecnologica-del-gpt3-y-4","text":"","title":"Desaf\u00edos \u00e9ticos actuales a la luz de la revoluci\u00f3n sociotecnol\u00f3gica del GPT3 y 4."},{"location":"ciclos/#chatgpt-en-la-industria-posibilidades-y-proyecciones","text":"","title":"ChatGPT en la Industria: posibilidades y proyecciones."},{"location":"ciclos/#alcances-y-limites-de-los-modelos-de-lenguaje","text":"","title":"Alcances y l\u00edmites de los modelos de lenguaje."},{"location":"publications/","text":"2023 M. Araneda, F. Bravo-Marquez, D. Parra, and R.F C\u00e1diz MUSIB: Musical Score Inpainting Benchmark . In EURASIP Journal on Audio, Speech, and Music Processing, 2023, 19 (2023). DOI:10.1186/s13636-023-00279-6 ( pdf ) G. Iturra-Bocaz and F. Bravo-Marquez RiverText: A Python Library for Training and Evaluating Incremental Word Embeddings from Text Data Stream . In Proceedings of the 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2023), Taipei, Taiwan. Association for Computing Machinery. Pages 3027\u20133036. DOI:10.1145/3539618.3591908 ( pdf ). Matias Rojas, Casimiro Pio Carrino, Aitor Gonzalez-Agirre, Jocelyn Dunstan, and Marta Villegas. 2022. Assessing the Limits of Straightforward Models for Nested Named Entity Recognition in Spanish Clinical Narratives. In Proceedings of the 13th International Workshop on Health Text Mining and Information Analysis (LOUHI), pages 14\u201325, Abu Dhabi, United Arab Emirates (Hybrid). Association for Computational Linguistics. (pdf) . Divide and Conquer: An Extreme Multi-Label Classification Approach for Coding Diseases and Procedures in Spanish (Barros et al., Louhi 2022) (pdf) . Claudio Aracena, Fabi\u00e1n Villena, Matias Rojas, and Jocelyn Dunstan. 2022. A Knowledge-Graph-Based Intrinsic Test for Benchmarking Medical Concept Embeddings and Pretrained Language Models. In Proceedings of the 13th International Workshop on Health Text Mining and Information Analysis (LOUHI), pages 197\u2013206, Abu Dhabi, United Arab Emirates (Hybrid). Association for Computational Linguistics. (pdf) . 2022 Sipiran, I., Mendoza, A., Apaza, A., Lopez, C.: Data-driven Restoration of Digital Archaeological Pottery with Point Cloud Analysis . International Journal of Computer Vision,130(9), pp 2149\u20132165. Springer. 2022. (pdf) Romanengo, C., Raffo, A., Biasotti, S., Falcidieno, B., Fotis, V., Romanelis, I., Psatha, E., Moustakas, K., Sipiran, I., Nguyen, Q., Chu, C., Nguyen-Ngoc, K., Vo, D., To, T., Nguyen, N., Le-Pham, N., Nguyen, H., Tran, M., Qie, Y., & Anwer, N.: SHREC 2022: Fitting and recognition of simple geometric primitives on point clouds. Computers & Graphics. Vol 107, October, pp. 32-49. Elsevier. 2022. Publisher site. Thompson, E.M., Ranieri, A., Biasotti, S., Chicch\u00f3n, M., Sipiran, I., Pham, M., Nguyen-Ho, T., Nguyen, H., & Tran, M.: SHREC 2022: pothole and crack detection in the road pavement using images and RGB-D data. Computers & Graphics. Vol 107, October, pp. 161-171. Elsevier. 2022 Publisher site. Matias Rojas, Felipe Bravo-Marquez, and Jocelyn Dunstan. 2022. Simple Yet Powerful: An Overlooked Architecture for Nested Named Entity Recognition . In Proceedings of the 29th International Conference on Computational Linguistics , pages 2108\u20132117, Gyeongju, Republic of Korea. International Committee on Computational Linguistics. (pdf) Matias Rojas, Jose Barros, Kinan Martin, Mauricio Araneda-Hernandez, and Jocelyn Dunstan. 2022. PLN CMM at SocialDisNER: Improving Detection of Disease Mentions in Tweets by Using Document-Level Features . In Proceedings of The Seventh Workshop on Social Media Mining for Health Applications, Workshop & Shared Task , pages 52\u201354, Gyeongju, Republic of Korea. Association for Computational Linguistics. (pdf) Clinical Flair: A Pre-Trained Language Model for Spanish Clinical Natural Language Processing (Rojas et al., ClinicalNLP 2022) (pdf) Rojas, M., Barros, J., Araneda, M., & Dunstan, J. (2022). FLERT-Matcher: A Two-Step Approach for Clinical Named Entity Recognition and Normalization. (pdf) P. Ba\u00e9z, F. Bravo-Marquez, J. Dunstan, M. Rojas, and F. Villena Automatic Extraction of Nested Entities in Clinical Referrals in Spanish . In ACM Transactions on Computing for Healthcare (HEALTH) , Volume 3, Issue 3, July 2022. Pages 1\u201322. DOI:10.1145/3498324 ( pdf ) J. Diaz, F. Bravo-Marquez and B. Poblete, Language Modeling on Location-Based Social Networks . In ISPRS International Journal of Geo-Information , Volume 11, Number 2, Article Number 147, February 2022. DOI: 10.3390/ijgi11020147 ( pdf ) F. Bravo-Marquez and C. Tamblay Words, Tweets and Reviews: Leveraging Affective Knowledge Between Multiple Domains . In Cognitive Computation , Volume 14, January 2022. Pages 388-406. DOI: 10.1007/s12559-021-09923-9 ( pdf ) F. Bravo-Marquez, A. Khanchandani, and B. Pfahringer Incremental word-vectors for time-evolving sentiment lexicon induction . In Cognitive Computation , Volume 14, January 2022. Pages 425-441. DOI:10.1007/s12559-021-09831-y ( pdf ) H. Sarmiento, F. Bravo-Marquez, E. Graells-Garrido, and B. Poblete Identifying and Characterizing New Expressions of Community Framing during Polarization . In Proceedings of the 16th The International AAAI Conference on Web and Social Media (ICWSM 2022) , Atlanta, Georgia, USA. AAAI Press. Pages 841-851. ( pdf ) F. D. Zamora-Reina, F. Bravo-Marquez, and D. Schlechtweg LSCDiscovery: A shared task on semantic change discovery and detection in Spanish . In Proceedings of the 3rd International Workshop on Computational Approaches to Historical Language Change (LCHANGE 2022), co-located with ACL 2022 , Dublin, Ireland. Association for Computational Linguistics. Pages 149\u2013164. ( pdf ), ( codalab ) V. Araujo, A. Caravallo, S. Kundu, J. Ca\u00f1ete, M. Mendoza, R. E. Mercer, F. Bravo-Marquez, M. Moens, and A. Soto Evaluation Benchmarks for Spanish Sentence Representations . In Proceedings of the 13th Edition of The Language Resources and Evaluation Conference (LREC 2022) , Marseille, France. Pages 6024-6034. ( pdf ) J. Ca\u00f1ete, S. Donoso, F. Bravo-Marquez, A. Caravallo, and V. Araujo ALBETO and DistilBETO: Lightweight Spanish Language Models . In Proceedings of the 13th Edition of The Language Resources and Evaluation Conference (LREC 2022) , Marseille, France. Pages 4291-4298. ( pdf ) Aym\u00e9 Arango , Jorge P\u00e9rez , Barbara Poblete, Hate speech detection is not as easy as you may think: A closer look at model validation (extended version). Inf. Syst. 105 : 101584 (2022) Jesus Perez-Martin , Benjamin Bustos , Silvio Jamil Ferzoli Guimar\u00e3es , Ivan Sipiran, Jorge P\u00e9rez , Grethel Coello Said : A comprehensive review of the video-to-text problem. Artif. Intell. Rev. 55(5) : 4165-4239 (2022) 2021 Manuel Alfonseca , Manuel Cebri\u00e1n , Antonio Fern\u00e1ndez Anta , Lorenzo Coviello , Andr\u00e9s Abeliuk, Iyad Rahwan : Superintelligence Cannot be Contained: Lessons from Computability Theory. J. Artif. Intell. Res. 70 : 65-76 (2021) Hernan Sarmiento , Barbara Poblete: Crisis communication: a comparative study of communication patterns across crisis events in social media. SAC 2021 : 1711-1720 F. Tobar, F. Bravo-Marquez, J. Dunstan, J. Fontbona, A. Maass, and D. Remenik, and J.F. Silva Data Science for Engineers: A Teaching Ecosystem . In IEEE Signal Processing Magazine , Volume 38, Issue 3, May 2021. Pages 144-153. DOI:10.1109/MSP.2021.3053551 ( pdf ) A. Ansell, F. Bravo-Marquez, and B. Pfahringer PolyLM: Learning about Polysemy through Language Modeling . In Proceedings of the 16th conference of the European Chapter of the Association for Computational Linguistics (EACL 2021) , Kyiv, Ukraine. Pages 563\u2013574. ( pdf ),( code ). J. Cerezo, A. Bergel, and F. Bravo-Marquez Tools Impact on the Quality of Annotations for Chat Untangling . In Proceedings of the 2021 ACL-IJCNLP Student Research Workshop (SRW) , Bangkok, Thailand. ( pdf ) J. Mu\u00f1oz and F. Bravo-Marquez Interventions Recommendation: Professionals\u2019 Observations Analysis in Special Needs Education . In Proceedings of the 16th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2021) , Co-located with EACL 2021, Kyiv, Ukraine. Pages 171-179 ( pdf ),( code ). Jocelyn Dunstan, Fabi\u00e1n Villena , Jorge P\u00e9rez , Ren\u00e9 Lagos : Supporting the classification of patients in public hospitals in Chile by designing, deploying and validating a system based on natural language processing. BMC Medical Informatics Decis. Mak. 21(1) : 208 (2021) Aimei Yang , Ian Myoungsu Choi , Andr\u00e9s Abeliuk, Adam J. Saffer , The Influence of Interdependence in Networked Publics Spheres: How Community-Level Interactions Affect the Evolution of Topics in Online Discourse. J. Comput. Mediat. Commun. 26(3) : 148-166 (2021) Zihao He , Negar Mokhberian , Ant\u00f3nio C\u00e2mara , Andr\u00e9s Abeliuk, Kristina Lerman : Detecting Polarized Topics Using Partisanship-aware Contextualized Topic Embeddings. EMNLP (Findings) 2021 : 2102-2118 Nathan Bartley , Andr\u00e9s Abeliuk, Emilio Ferrara , Kristina Lerman : Auditing Algorithmic Bias on Twitter. WebSci 2021 : 65-73 2020 Barbara Poblete , Jorge P\u00e9rez: Minding the AI gap in LATAM. Commun. ACM 63(11) : 61-63 (2020) Jose Miguel Herrera , Denis Parra , Barbara Poblete: Social QA in non-CQA platforms. Future Gener. Comput. Syst. 105 : 631-649 (2020) Henry Rosales-M\u00e9ndez , Aidan Hogan , Barbara Poblete: Fine-Grained Entity Linking. J. Web Semant. 65 : 100600 (2020) Javier Carrasco , Aidan Hogan , Jorge P\u00e9rez: Laconic Image Classification: Human vs. Machine Performance. CIKM 2020 : 115-124 Jorge P\u00e9rez, Francisco Plana : Food sharing gave birth to social networks. CogSci 2020 P. B\u00e1ez, F. Villena, M. Rojas, M. Dur\u00e1n, and J. Dunstan The Chilean Waiting List Corpus: a new resource for clinical Named Entity Recognition in Spanish , In Proceedings of the 3rd Clinical Natural Language Processing Workshop , November, 291-300, 2020. DOI:10.18653/v1/2020.clinicalnlp-1.32 ( pdf ) Model Interpretability through the Lens of Computational Complexity Pablo Barcel\u00f3, Mikael Monet, Jorge P\u00e9rez, Bernardo Subercaseaux NeurIPS 2020 J. Diaz, B. Poblete, and F. Bravo-Marquez An Integrated Model for Textual Social Media Data with Spatio-Temporal Dimensions , In Information Processing & Management , Volume 57, Issue 5, 2020. DOI:10.1016/j.ipm.2020.102219 ( pdf ) D.G. Trye, A.S. Calude, F. Bravo-Marquez, and T.T. Keegan Hybrid Hashtags: #YouKnowYoureAKiwiWhen your Tweet contains M\u0101ori and English , In Frontiers in Artificial Intelligence, section Language and Computation Volume 3, Article 15, April 2020. DOI: 10.3389/frai.2020.00015. ( pdf | supplementary Material ) P. Badilla, F. Bravo-Marquez, and J. P\u00e9rez WEFE: The Word Embeddings Fairness Evaluation Framework In Proceedings of the 29th International Joint Conference on Artificial Intelligence and the 17th Pacific Rim International Conference on Artificial Intelligence (IJCAI-PRICAI 2020) , Yokohama, Japan. Pages 430-436. DOI:10.24963/ijcai.2020/60. Acceptance rate: 12.6%. ( pdf ),( code ). The Logical Expressiveness of Graph Neural Networks Pablo Barcel\u00f3, Egor V. Kostylev, Mikael Monet, Jorge P\u00e9rez, Juan Reutter and Juan-Pablo Silva, ICLR 2020 ( talk , slides , poster ) Spanish Pre-Trained BERT Model and Evaluation Data Jose Ca\u00f1ete, Gabriel Chaperon, Rodrigo Fuentes, Jou-Hui Ho, Hojin Kang and Jorge P\u00e9rez PML4DC @ ICLR 2020 ( talk , slides , code ) Predicting Unplanned Readmissions with Highly Unstructured Data Constanza Fierro, Jorge P\u00e9rez, and Javier Mora, AI4AH @ ICLR 2020. Jesus Perez-Martin , Benjamin Bustos , Jorge P\u00e9rez: Attentive Visual Semantic Specialized Network for Video Captioning. ICPR 2020 : 5767-5774 2019 Jorge P\u00e9rez, Javier Marinkovi\u0107 and Pablo Barcel\u00f3, On the Turing Completeness of Modern Neural Network Architectures, ICLR 2019. ( pdf ) ( poster ) Aym\u00e9 Arango, Jorge P\u00e9rez, Barbara Poblete , Hate Speech Detection is Not as Easy as You May Think: A Closer Look at Model Validation, SIGIR 2019. ( pdf ) Pablo Barcel\u00f3, Nelson Higuera, Jorge P\u00e9rez and Bernardo Subercaseaux, Expressiveness of Matrix and Tensor Query Languages in terms of ML Operators, DEEM @ SIGMOD 2019. ( pdf ) ( slides ) F. Bravo-Marquez, E. Frank, B. Pfahringer, and S. M. Mohammad AffectiveTweets: a WEKA Package for Analyzing Affect in Tweets , In Journal of Machine Learning Research 20(92): Pages 1\u22126, 2019. ( pdf ) S. Lang, F. Bravo-Marquez, C. Beckham, M. Hall, and E. Frank WekaDeeplearning4j: a Deep Learning Package for Weka based on DeepLearning4j , In Knowledge-Based Systems , Volume 178, 15 August 2019, Pages 48-50. DOI: 10.1016/j.knosys.2019.04.013 ( pdf ) A. Ansell, F. Bravo-Marquez, and B. Pfahringer An ELMo-inspired approach to SemDeep-5's Word-in-Context task . In Proceedings of the 5th Workshop on Semantic Deep Learning (SemDeep-5) co-located with IJCAI 2019 in Macau, China. ( pdf ) D. Trye, A. S. Calude, F. Bravo-Marquez, and T. T Keegan M\u0101ori Loanwords: A Corpus of New Zealand English Tweets . In Proceedings of the 2019 ACL Student Research Workshop (SRW), Florence, Italy. ( pdf ) F. Villena and J. Dunstan Obtenci\u00f3n autom\u00e1tica de palabras clave en textos cl\u00ednicos: una aplicaci\u00f3n de procesamiento del lenguaje natural a datos masivos de sospecha diagn\u00f3stica en Chile . In Revista m\u00e9dica de Chile , Volume 147, 2019. DOI:http://dx.doi.org/10.4067/s0034-98872019001001229 ( pdf ) Marcelo Mendoza , Barbara Poblete, Ignacio Valderrama : Nowcasting earthquake damages with Twitter. EPJ Data Sci. 8(1) : 3:1-3:23 (2019) Henry Rosales-M\u00e9ndez , Aidan Hogan , Barbara Poblete: Fine-Grained Evaluation for Entity Linking. EMNLP/IJCNLP (1) 2019 : 718-727 Marcelo Mendoza , B\u00e1rbara Poblete, Ignacio Valderrama : Estimating Ground Shaking Regions with Social Media Propagation Trees. HCI (13) 2019 : 356-369 Mauricio Quezada , Barbara Poblete: A Lightweight Representation of News Events on Social Media. SIGIR 2019 : 1049-1052 Juglar Diaz , Barbara Poblete: Car Theft Reports: a Temporal Analysis from a Social Media Perspective. WWW (Companion Volume) 2019 : 779-782 Karen Or\u00f3stica , Barbara Poblete: Mining the Relationship BetweenCar Theft and Places of Social Interest in Santiago Chile. WWW (Companion Volume) 2019 : 811-814 Henry Rosales-M\u00e9ndez , Aidan Hogan , Barbara Poblete: NIFify: Towards Better Quality Entity Linking Datasets. WWW (Companion Volume) 2019 : 815-818","title":"Publications"},{"location":"publications/#2023","text":"M. Araneda, F. Bravo-Marquez, D. Parra, and R.F C\u00e1diz MUSIB: Musical Score Inpainting Benchmark . In EURASIP Journal on Audio, Speech, and Music Processing, 2023, 19 (2023). DOI:10.1186/s13636-023-00279-6 ( pdf ) G. Iturra-Bocaz and F. Bravo-Marquez RiverText: A Python Library for Training and Evaluating Incremental Word Embeddings from Text Data Stream . In Proceedings of the 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2023), Taipei, Taiwan. Association for Computing Machinery. Pages 3027\u20133036. DOI:10.1145/3539618.3591908 ( pdf ). Matias Rojas, Casimiro Pio Carrino, Aitor Gonzalez-Agirre, Jocelyn Dunstan, and Marta Villegas. 2022. Assessing the Limits of Straightforward Models for Nested Named Entity Recognition in Spanish Clinical Narratives. In Proceedings of the 13th International Workshop on Health Text Mining and Information Analysis (LOUHI), pages 14\u201325, Abu Dhabi, United Arab Emirates (Hybrid). Association for Computational Linguistics. (pdf) . Divide and Conquer: An Extreme Multi-Label Classification Approach for Coding Diseases and Procedures in Spanish (Barros et al., Louhi 2022) (pdf) . Claudio Aracena, Fabi\u00e1n Villena, Matias Rojas, and Jocelyn Dunstan. 2022. A Knowledge-Graph-Based Intrinsic Test for Benchmarking Medical Concept Embeddings and Pretrained Language Models. In Proceedings of the 13th International Workshop on Health Text Mining and Information Analysis (LOUHI), pages 197\u2013206, Abu Dhabi, United Arab Emirates (Hybrid). Association for Computational Linguistics. (pdf) .","title":"2023"},{"location":"publications/#2022","text":"Sipiran, I., Mendoza, A., Apaza, A., Lopez, C.: Data-driven Restoration of Digital Archaeological Pottery with Point Cloud Analysis . International Journal of Computer Vision,130(9), pp 2149\u20132165. Springer. 2022. (pdf) Romanengo, C., Raffo, A., Biasotti, S., Falcidieno, B., Fotis, V., Romanelis, I., Psatha, E., Moustakas, K., Sipiran, I., Nguyen, Q., Chu, C., Nguyen-Ngoc, K., Vo, D., To, T., Nguyen, N., Le-Pham, N., Nguyen, H., Tran, M., Qie, Y., & Anwer, N.: SHREC 2022: Fitting and recognition of simple geometric primitives on point clouds. Computers & Graphics. Vol 107, October, pp. 32-49. Elsevier. 2022. Publisher site. Thompson, E.M., Ranieri, A., Biasotti, S., Chicch\u00f3n, M., Sipiran, I., Pham, M., Nguyen-Ho, T., Nguyen, H., & Tran, M.: SHREC 2022: pothole and crack detection in the road pavement using images and RGB-D data. Computers & Graphics. Vol 107, October, pp. 161-171. Elsevier. 2022 Publisher site. Matias Rojas, Felipe Bravo-Marquez, and Jocelyn Dunstan. 2022. Simple Yet Powerful: An Overlooked Architecture for Nested Named Entity Recognition . In Proceedings of the 29th International Conference on Computational Linguistics , pages 2108\u20132117, Gyeongju, Republic of Korea. International Committee on Computational Linguistics. (pdf) Matias Rojas, Jose Barros, Kinan Martin, Mauricio Araneda-Hernandez, and Jocelyn Dunstan. 2022. PLN CMM at SocialDisNER: Improving Detection of Disease Mentions in Tweets by Using Document-Level Features . In Proceedings of The Seventh Workshop on Social Media Mining for Health Applications, Workshop & Shared Task , pages 52\u201354, Gyeongju, Republic of Korea. Association for Computational Linguistics. (pdf) Clinical Flair: A Pre-Trained Language Model for Spanish Clinical Natural Language Processing (Rojas et al., ClinicalNLP 2022) (pdf) Rojas, M., Barros, J., Araneda, M., & Dunstan, J. (2022). FLERT-Matcher: A Two-Step Approach for Clinical Named Entity Recognition and Normalization. (pdf) P. Ba\u00e9z, F. Bravo-Marquez, J. Dunstan, M. Rojas, and F. Villena Automatic Extraction of Nested Entities in Clinical Referrals in Spanish . In ACM Transactions on Computing for Healthcare (HEALTH) , Volume 3, Issue 3, July 2022. Pages 1\u201322. DOI:10.1145/3498324 ( pdf ) J. Diaz, F. Bravo-Marquez and B. Poblete, Language Modeling on Location-Based Social Networks . In ISPRS International Journal of Geo-Information , Volume 11, Number 2, Article Number 147, February 2022. DOI: 10.3390/ijgi11020147 ( pdf ) F. Bravo-Marquez and C. Tamblay Words, Tweets and Reviews: Leveraging Affective Knowledge Between Multiple Domains . In Cognitive Computation , Volume 14, January 2022. Pages 388-406. DOI: 10.1007/s12559-021-09923-9 ( pdf ) F. Bravo-Marquez, A. Khanchandani, and B. Pfahringer Incremental word-vectors for time-evolving sentiment lexicon induction . In Cognitive Computation , Volume 14, January 2022. Pages 425-441. DOI:10.1007/s12559-021-09831-y ( pdf ) H. Sarmiento, F. Bravo-Marquez, E. Graells-Garrido, and B. Poblete Identifying and Characterizing New Expressions of Community Framing during Polarization . In Proceedings of the 16th The International AAAI Conference on Web and Social Media (ICWSM 2022) , Atlanta, Georgia, USA. AAAI Press. Pages 841-851. ( pdf ) F. D. Zamora-Reina, F. Bravo-Marquez, and D. Schlechtweg LSCDiscovery: A shared task on semantic change discovery and detection in Spanish . In Proceedings of the 3rd International Workshop on Computational Approaches to Historical Language Change (LCHANGE 2022), co-located with ACL 2022 , Dublin, Ireland. Association for Computational Linguistics. Pages 149\u2013164. ( pdf ), ( codalab ) V. Araujo, A. Caravallo, S. Kundu, J. Ca\u00f1ete, M. Mendoza, R. E. Mercer, F. Bravo-Marquez, M. Moens, and A. Soto Evaluation Benchmarks for Spanish Sentence Representations . In Proceedings of the 13th Edition of The Language Resources and Evaluation Conference (LREC 2022) , Marseille, France. Pages 6024-6034. ( pdf ) J. Ca\u00f1ete, S. Donoso, F. Bravo-Marquez, A. Caravallo, and V. Araujo ALBETO and DistilBETO: Lightweight Spanish Language Models . In Proceedings of the 13th Edition of The Language Resources and Evaluation Conference (LREC 2022) , Marseille, France. Pages 4291-4298. ( pdf ) Aym\u00e9 Arango , Jorge P\u00e9rez , Barbara Poblete, Hate speech detection is not as easy as you may think: A closer look at model validation (extended version). Inf. Syst. 105 : 101584 (2022) Jesus Perez-Martin , Benjamin Bustos , Silvio Jamil Ferzoli Guimar\u00e3es , Ivan Sipiran, Jorge P\u00e9rez , Grethel Coello Said : A comprehensive review of the video-to-text problem. Artif. Intell. Rev. 55(5) : 4165-4239 (2022)","title":"2022"},{"location":"publications/#2021","text":"Manuel Alfonseca , Manuel Cebri\u00e1n , Antonio Fern\u00e1ndez Anta , Lorenzo Coviello , Andr\u00e9s Abeliuk, Iyad Rahwan : Superintelligence Cannot be Contained: Lessons from Computability Theory. J. Artif. Intell. Res. 70 : 65-76 (2021) Hernan Sarmiento , Barbara Poblete: Crisis communication: a comparative study of communication patterns across crisis events in social media. SAC 2021 : 1711-1720 F. Tobar, F. Bravo-Marquez, J. Dunstan, J. Fontbona, A. Maass, and D. Remenik, and J.F. Silva Data Science for Engineers: A Teaching Ecosystem . In IEEE Signal Processing Magazine , Volume 38, Issue 3, May 2021. Pages 144-153. DOI:10.1109/MSP.2021.3053551 ( pdf ) A. Ansell, F. Bravo-Marquez, and B. Pfahringer PolyLM: Learning about Polysemy through Language Modeling . In Proceedings of the 16th conference of the European Chapter of the Association for Computational Linguistics (EACL 2021) , Kyiv, Ukraine. Pages 563\u2013574. ( pdf ),( code ). J. Cerezo, A. Bergel, and F. Bravo-Marquez Tools Impact on the Quality of Annotations for Chat Untangling . In Proceedings of the 2021 ACL-IJCNLP Student Research Workshop (SRW) , Bangkok, Thailand. ( pdf ) J. Mu\u00f1oz and F. Bravo-Marquez Interventions Recommendation: Professionals\u2019 Observations Analysis in Special Needs Education . In Proceedings of the 16th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2021) , Co-located with EACL 2021, Kyiv, Ukraine. Pages 171-179 ( pdf ),( code ). Jocelyn Dunstan, Fabi\u00e1n Villena , Jorge P\u00e9rez , Ren\u00e9 Lagos : Supporting the classification of patients in public hospitals in Chile by designing, deploying and validating a system based on natural language processing. BMC Medical Informatics Decis. Mak. 21(1) : 208 (2021) Aimei Yang , Ian Myoungsu Choi , Andr\u00e9s Abeliuk, Adam J. Saffer , The Influence of Interdependence in Networked Publics Spheres: How Community-Level Interactions Affect the Evolution of Topics in Online Discourse. J. Comput. Mediat. Commun. 26(3) : 148-166 (2021) Zihao He , Negar Mokhberian , Ant\u00f3nio C\u00e2mara , Andr\u00e9s Abeliuk, Kristina Lerman : Detecting Polarized Topics Using Partisanship-aware Contextualized Topic Embeddings. EMNLP (Findings) 2021 : 2102-2118 Nathan Bartley , Andr\u00e9s Abeliuk, Emilio Ferrara , Kristina Lerman : Auditing Algorithmic Bias on Twitter. WebSci 2021 : 65-73","title":"2021"},{"location":"publications/#2020","text":"Barbara Poblete , Jorge P\u00e9rez: Minding the AI gap in LATAM. Commun. ACM 63(11) : 61-63 (2020) Jose Miguel Herrera , Denis Parra , Barbara Poblete: Social QA in non-CQA platforms. Future Gener. Comput. Syst. 105 : 631-649 (2020) Henry Rosales-M\u00e9ndez , Aidan Hogan , Barbara Poblete: Fine-Grained Entity Linking. J. Web Semant. 65 : 100600 (2020) Javier Carrasco , Aidan Hogan , Jorge P\u00e9rez: Laconic Image Classification: Human vs. Machine Performance. CIKM 2020 : 115-124 Jorge P\u00e9rez, Francisco Plana : Food sharing gave birth to social networks. CogSci 2020 P. B\u00e1ez, F. Villena, M. Rojas, M. Dur\u00e1n, and J. Dunstan The Chilean Waiting List Corpus: a new resource for clinical Named Entity Recognition in Spanish , In Proceedings of the 3rd Clinical Natural Language Processing Workshop , November, 291-300, 2020. DOI:10.18653/v1/2020.clinicalnlp-1.32 ( pdf ) Model Interpretability through the Lens of Computational Complexity Pablo Barcel\u00f3, Mikael Monet, Jorge P\u00e9rez, Bernardo Subercaseaux NeurIPS 2020 J. Diaz, B. Poblete, and F. Bravo-Marquez An Integrated Model for Textual Social Media Data with Spatio-Temporal Dimensions , In Information Processing & Management , Volume 57, Issue 5, 2020. DOI:10.1016/j.ipm.2020.102219 ( pdf ) D.G. Trye, A.S. Calude, F. Bravo-Marquez, and T.T. Keegan Hybrid Hashtags: #YouKnowYoureAKiwiWhen your Tweet contains M\u0101ori and English , In Frontiers in Artificial Intelligence, section Language and Computation Volume 3, Article 15, April 2020. DOI: 10.3389/frai.2020.00015. ( pdf | supplementary Material ) P. Badilla, F. Bravo-Marquez, and J. P\u00e9rez WEFE: The Word Embeddings Fairness Evaluation Framework In Proceedings of the 29th International Joint Conference on Artificial Intelligence and the 17th Pacific Rim International Conference on Artificial Intelligence (IJCAI-PRICAI 2020) , Yokohama, Japan. Pages 430-436. DOI:10.24963/ijcai.2020/60. Acceptance rate: 12.6%. ( pdf ),( code ). The Logical Expressiveness of Graph Neural Networks Pablo Barcel\u00f3, Egor V. Kostylev, Mikael Monet, Jorge P\u00e9rez, Juan Reutter and Juan-Pablo Silva, ICLR 2020 ( talk , slides , poster ) Spanish Pre-Trained BERT Model and Evaluation Data Jose Ca\u00f1ete, Gabriel Chaperon, Rodrigo Fuentes, Jou-Hui Ho, Hojin Kang and Jorge P\u00e9rez PML4DC @ ICLR 2020 ( talk , slides , code ) Predicting Unplanned Readmissions with Highly Unstructured Data Constanza Fierro, Jorge P\u00e9rez, and Javier Mora, AI4AH @ ICLR 2020. Jesus Perez-Martin , Benjamin Bustos , Jorge P\u00e9rez: Attentive Visual Semantic Specialized Network for Video Captioning. ICPR 2020 : 5767-5774","title":"2020"},{"location":"publications/#2019","text":"Jorge P\u00e9rez, Javier Marinkovi\u0107 and Pablo Barcel\u00f3, On the Turing Completeness of Modern Neural Network Architectures, ICLR 2019. ( pdf ) ( poster ) Aym\u00e9 Arango, Jorge P\u00e9rez, Barbara Poblete , Hate Speech Detection is Not as Easy as You May Think: A Closer Look at Model Validation, SIGIR 2019. ( pdf ) Pablo Barcel\u00f3, Nelson Higuera, Jorge P\u00e9rez and Bernardo Subercaseaux, Expressiveness of Matrix and Tensor Query Languages in terms of ML Operators, DEEM @ SIGMOD 2019. ( pdf ) ( slides ) F. Bravo-Marquez, E. Frank, B. Pfahringer, and S. M. Mohammad AffectiveTweets: a WEKA Package for Analyzing Affect in Tweets , In Journal of Machine Learning Research 20(92): Pages 1\u22126, 2019. ( pdf ) S. Lang, F. Bravo-Marquez, C. Beckham, M. Hall, and E. Frank WekaDeeplearning4j: a Deep Learning Package for Weka based on DeepLearning4j , In Knowledge-Based Systems , Volume 178, 15 August 2019, Pages 48-50. DOI: 10.1016/j.knosys.2019.04.013 ( pdf ) A. Ansell, F. Bravo-Marquez, and B. Pfahringer An ELMo-inspired approach to SemDeep-5's Word-in-Context task . In Proceedings of the 5th Workshop on Semantic Deep Learning (SemDeep-5) co-located with IJCAI 2019 in Macau, China. ( pdf ) D. Trye, A. S. Calude, F. Bravo-Marquez, and T. T Keegan M\u0101ori Loanwords: A Corpus of New Zealand English Tweets . In Proceedings of the 2019 ACL Student Research Workshop (SRW), Florence, Italy. ( pdf ) F. Villena and J. Dunstan Obtenci\u00f3n autom\u00e1tica de palabras clave en textos cl\u00ednicos: una aplicaci\u00f3n de procesamiento del lenguaje natural a datos masivos de sospecha diagn\u00f3stica en Chile . In Revista m\u00e9dica de Chile , Volume 147, 2019. DOI:http://dx.doi.org/10.4067/s0034-98872019001001229 ( pdf ) Marcelo Mendoza , Barbara Poblete, Ignacio Valderrama : Nowcasting earthquake damages with Twitter. EPJ Data Sci. 8(1) : 3:1-3:23 (2019) Henry Rosales-M\u00e9ndez , Aidan Hogan , Barbara Poblete: Fine-Grained Evaluation for Entity Linking. EMNLP/IJCNLP (1) 2019 : 718-727 Marcelo Mendoza , B\u00e1rbara Poblete, Ignacio Valderrama : Estimating Ground Shaking Regions with Social Media Propagation Trees. HCI (13) 2019 : 356-369 Mauricio Quezada , Barbara Poblete: A Lightweight Representation of News Events on Social Media. SIGIR 2019 : 1049-1052 Juglar Diaz , Barbara Poblete: Car Theft Reports: a Temporal Analysis from a Social Media Perspective. WWW (Companion Volume) 2019 : 779-782 Karen Or\u00f3stica , Barbara Poblete: Mining the Relationship BetweenCar Theft and Places of Social Interest in Santiago Chile. WWW (Companion Volume) 2019 : 811-814 Henry Rosales-M\u00e9ndez , Aidan Hogan , Barbara Poblete: NIFify: Towards Better Quality Entity Linking Datasets. WWW (Companion Volume) 2019 : 815-818","title":"2019"},{"location":"resources/","text":"We count with the following GPU-equipped machines: RELELA-01 CPU: Intel Core i7-9700F RAM: 128 GB DDR4 HDD1: 500GB Crucial P2 PCIe M.2 NVME HDD2: 480GB WDC WDS480G2G0B M.2 SATA3 GPU0: GeForce RTX 3090 24GB GPU1: GeForce RTX 3090 24GB RELELA-02 CPU: Intel Core i7-11700K RAM: 128 GB DDR4 HDD1: 500GB Crucial P2 PCIe M.2 NVME HDD2: 2TB Kingston NV1 PCIe M.2 NVME GPU0: GeForce RTX 3090 24GB GPU1: GeForce RTX 3090 24GB RELELA-03 CPU : Intel i7-11700K RAM : 128 GB DDR4 HDD1 : 960GB NVME HDD2 : 2TB SATA3 SSD HDD2 : 2TB SATA3 SSD GPU0: GeForce RTX 3090 24GB GPU1: GeForce RTX 3090 24GB RELELA-04 CPU : AMD Ryzen 7 5700X 8-Core Processor RAM : 96GB DDR4 HDD1: 2TB KINGSTON SFYRD2000G PCIe M.2 NVME GPU0: GeForce RTX A6000 48GB GPU1: GeForce RTX A6000 48GB GPUs connected via NVLINK RELELA-05 CPU : AMD Ryzen 7 5700X 8-Core Processor RAM : 128GB DDR4 HDD1: 2TB KINGSTON SFYRD2000G PCIe M.2 NVME GPU0: GeForce RTX A6000 48GB GPU1: GeForce RTX A6000 48GB GPUs connected via NVLINK RELELA-06 CPU : AMD EPYC 7282 16-Core Processor RAM : 128GB DDR4 HDD1: 1TB Samsung SSD 980 PRO PCIe M.2 NVME HDD2: 4TB Seagate Exos 7E10 SATA3 GPU0: GeForce RTX A5000 24GB GPU1: GeForce RTX A5000 24GB GPU2: GeForce RTX A5000 24GB","title":"Computing Resources"},{"location":"resources/#relela-01","text":"CPU: Intel Core i7-9700F RAM: 128 GB DDR4 HDD1: 500GB Crucial P2 PCIe M.2 NVME HDD2: 480GB WDC WDS480G2G0B M.2 SATA3 GPU0: GeForce RTX 3090 24GB GPU1: GeForce RTX 3090 24GB","title":"RELELA-01"},{"location":"resources/#relela-02","text":"CPU: Intel Core i7-11700K RAM: 128 GB DDR4 HDD1: 500GB Crucial P2 PCIe M.2 NVME HDD2: 2TB Kingston NV1 PCIe M.2 NVME GPU0: GeForce RTX 3090 24GB GPU1: GeForce RTX 3090 24GB","title":"RELELA-02"},{"location":"resources/#relela-03","text":"CPU : Intel i7-11700K RAM : 128 GB DDR4 HDD1 : 960GB NVME HDD2 : 2TB SATA3 SSD HDD2 : 2TB SATA3 SSD GPU0: GeForce RTX 3090 24GB GPU1: GeForce RTX 3090 24GB","title":"RELELA-03"},{"location":"resources/#relela-04","text":"CPU : AMD Ryzen 7 5700X 8-Core Processor RAM : 96GB DDR4 HDD1: 2TB KINGSTON SFYRD2000G PCIe M.2 NVME GPU0: GeForce RTX A6000 48GB GPU1: GeForce RTX A6000 48GB GPUs connected via NVLINK","title":"RELELA-04"},{"location":"resources/#relela-05","text":"CPU : AMD Ryzen 7 5700X 8-Core Processor RAM : 128GB DDR4 HDD1: 2TB KINGSTON SFYRD2000G PCIe M.2 NVME GPU0: GeForce RTX A6000 48GB GPU1: GeForce RTX A6000 48GB GPUs connected via NVLINK","title":"RELELA-05"},{"location":"resources/#relela-06","text":"CPU : AMD EPYC 7282 16-Core Processor RAM : 128GB DDR4 HDD1: 1TB Samsung SSD 980 PRO PCIe M.2 NVME HDD2: 4TB Seagate Exos 7E10 SATA3 GPU0: GeForce RTX A5000 24GB GPU1: GeForce RTX A5000 24GB GPU2: GeForce RTX A5000 24GB","title":"RELELA-06"},{"location":"seminars/","text":"We hold weekly meetings on Wednesdays at 3PM at Auditorio Philippe Frajolet (303) Tercer Piso Edificio Poniente Beauchef 851. Our meeting's calendar Some of our seminars are available in our Playlist . Minutas (In Spanish) 02/08/2023 Ricardo Baeza-Yates present\u00f3 su seminario titulado: Inteligencia Artificial Responsable ( video ). 10/07/2023 Mircea Petrache present\u00f3 su seminario titulado: Conformal Language Modeling ( slides ). 07/05/2023 Edison Marrese-Taylor present\u00f3 su seminario titulado: Learning to Represent Edits ( slides ). 31/05/2023 Ciclo de charlas ChatGPT: Panel de Discusi\u00f3n - Alcances y l\u00edmites de los modelos de lenguaje. Panelitas: Cristi\u00e1n Buc (CENIA), slides mini-presentaci\u00f3n. Magdalena Salda\u00f1a (UC/IMFD). Mart\u00edn C\u00e1ceres (MINEDUC). Felipe Tobar (IDIA Uchile, CMM). Moderador: Claudio Guti\u00e9rrez (DCC-IMFD). 24/05/2023 Ciclo de charlas ChatGPT en la Industria: posibilidades y proyecciones ( video ): Jorge Per\u00e9z present\u00f3 su seminario: IA sin far\u00e1ndula ( slides ). Manuel Pe\u00f1a present\u00f3 su seminario: GPT y Agentes, Como Conversar con tu App ( slides ). 17/05/2023 Ciclo de Charlas de ChatGPT: Gabriela Arriagada present\u00f3 su seminario, Desaf\u00edos \u00e9ticos actuales a la luz de la revoluci\u00f3n sociotecnol\u00f3gica del GPT3 y 4 ( slides )( video ). 10/05/2023 Ciclo de Charlas ChatGPT: Felipe Bravo present\u00f3 su seminario titulado, Un recorrido por los Modelos de Lenguaje: desde Shannon a GPT-4 ( slides )( video ). 04/05/2023 Ciclo de Charlas ChatGPT: Jorge Ortiz present\u00f3 su seminario titulado, \u00bfPuede ChatGPT conquistar el mundo? Lenguaje humano vs lenguaje de m\u00e1quina ( slides )( video ). 26/04/2023 Mauricio Araneda present\u00f3 su seminario titulado: MUSIB: Musical Score Inpainting Benchmark ( slides ). 19/04/2023 Felipe Urrutia present\u00f3 su seminario titulado: The Role of Natural Language Processing in Advancing Competency-Based Education and Mathematics Learning in Fourth Graders ( slides ) 12/04/2023 Gabriel Iturra present\u00f3 su charla de tesis II titulada: RiverText: A Framework for Training and Evaluating Incremental Word Embeddings from Text Data Streams ( slides )( v\u00eddeo ). 05/04/2023 Valentin Barriere present\u00f3 su seminario titulada: Multilingual Multi-target Stance Recognition in Online Public Consultations ( slides ) 29/03/2023 Jos\u00e9 Ca\u00f1ete present\u00f3 su charla de tesis II titulada: Light and Fast Language Models for Spanish Through Compression Techniques ( slides )( video ). 25/01/2023 Valentin Barriere present\u00f3 su seminario titulado: Two improvements for mutli-lingual in-context classification over tweets using transformers ( slides ). 18/01/2023 Presentaciones rel\u00e1mpago de los miembros de Relela ( slides ). 11/01/2023 Mircea Petrache present\u00f3 su seminario titulada: Word embeddings analogies and paraphrases: proofs and open problems ( slides ). 04/01/2023 Se realizo una reuni\u00f3n de coordinaci\u00f3n para futuras actividades Relela, donde se tomaron los siguientes acuerdos: Evento con presentaciones rel\u00e1mpagos sobre el tema que cada uno trabaja (2 minutos de presentaci\u00f3n con 1 diapositiva). Profesores de ReLeLa incorporar\u00e1n a sus estudiantes. Presentaci\u00f3n periodica de papers (semanal). Definir roles en el grupo. 21/12/2022 Se presentaron 2 charlas de Tesis I de mag\u00edster, 1) Clemente Henr\u00edquez: Evolution of topic and issues in Chilean news ( slides ), 2) Ignacio Meza: Benchmarking video action features for the video temporary sentence grounding task ( slides ). 14/12/2022 Jorge Ortiz present\u00f3 su charla de Tesis I de mag\u00edster titulada: \"Attitude Analysis: a linguistic-based task for detailed position detection in texts\" ( slides ). 07/12/2022 Mar\u00eda Jos\u00e9 Zambrano present\u00f3 su charla de Tesis I de mag\u00edster titulada: \"Comparison and Improvement of Bias Mitigation Algorithms for Word Embeddings\" ( slides ). 22/07/2022 Mauricio Araneda present\u00f3 su charla de Tesis II de mag\u00edster titulada: \"Computers making music? Measuring current progress with MUSIB evaluation\" ( slides ). 13/07/2022 Se presentaron 3 charlas de Tesis I de mag\u00edster, 1) Jos\u00e9 Espina: Marco de trabajo de calibraci\u00f3n r\u00e1pida de confianza, en toma de decisiones asistidas por IA, 2) Alfonso Valderrama : Entrop\u00eda de Shannon como medida de predictibilidad de sistemas de recomendaci\u00f3n, 3)Ignacio Nu\u00f1ez: Defining an extensible architecture for a multi-task GUI-oriented Machine Learning software. 22/06/2022 Juan Pablo Silva present\u00f3 su charla de Tesis II de mag\u00edster titulada: \"Logic-based interpretability of Graph Neural Networks\" 28/04/2022 Miguel Cordero del Servicio de Salud Metropolitano Sur Oriente de Santiago de Chile, nos present\u00f3 \"Tendencias de la salud mental en los primeros 20 a\u00f1os de vida de usuarios/as de servicios de salud en el sur oriente de Santiago: \u00bfqu\u00e9 podemos aprender de las notas medicas?\" 05/01/2022 Rolando Kindelan nos di\u00f3 una charla titulado \"An\u00e1lisis Topol\u00f3gico de Datos (TDA): antecedentes, actualidad y perspectivas\" 22/12/2021 El alumno de mag\u00edster Jos\u00e9 Ca\u00f1ete present\u00f3 su charla de tesis I: \"Efficient models for Spanish NLP through Knowledge Distillation\" ( slides )( video ) 15/12/2021 El alumno de mag\u00edster Mat\u00edas Rojas present\u00f3 su charla de tesis II titulada: Nested named entity recognition in diagnoses from the Chilean Waiting List in public hospitals ( slides ) 01/12/2021 Los alumnos de mag\u00edster Humberto Rodrigues y David Rojas presentaron sus charlas de Tesis I tituladas \"Exploring bias metric strategies in contextualized embeddings\" y \"Word Embedding Bias Origin Detection\". 19/11/2021 Javier Mu\u00f1oz present\u00f3 su trabajo de tesis de mag\u00edster: \"Aprendizaje multi-instancia multi-etiqueta en la recomendaci\u00f3n de intervenciones\" 29/09/2021 Cristian Ahumada present\u00f3 su trabajo: \"Dise\u00f1o y desarrollo de un software de apoyo para el aprendizaje del Mapuzugun\" 22/09/2021 Mauricio Araneda present\u00f3 un tutorial sobre VAEs. ( slides ) 01/09/2021 Pablo Badilla nos habl\u00f3 sobre su trabajo en el proyecto \"lxs 400 \" 07/07/2021 Los alumnos de mag\u00edster Basti\u00e1n Matamala, Mauricio Araneda y Gabriel Iturra presentaron sus charlas de Tesis I. 05/05/2021 Carolina Chiu habl\u00f3 sobre el testeo de word embeddings en el contexto cl\u00ednico. 21/04/2021 Cristi\u00e1n Candia (UDD) nos habl\u00f3 sobre su trabajo en \"Inteligencia Colectiva\". 14/04/2021 Gast\u00f3n L'huillier nos habl\u00f3 sobre Machine Learning Engineering, infraestructura y todos los desaf\u00edos de poner en modelos en producci\u00f3n. ( slides ) 24/03/2021 Andr\u00e9s Abeliuk present\u00f3 su l\u00ednea de investigaci\u00f3n en tema de polarizaci\u00f3n. 17/03/2021 Alan Ansell present\u00f3 su trabajo sobre PolyLM, un LM pol\u00edsemico ( video ) 29/01/2021 Felipe Bravo dio un tutorial introductorio a la inferencia Bayesiana. 20/01/2021 Daniel Diomedi present\u00f3 su charla de Tesis II sobre Question Answering sobre Wikidata usando Entity Linking and Neural Semantic Parsing. 13/01/2021 Javier Vera present\u00f3 su trabajo sobre Aproximaciones computacionales a la diversidad ling\u00fc\u00edstica de Sudam\u00e9rica (la charla fue grabada). 06/01/2021 Pablo Badilla present\u00f3 su trabajo sobre sesgo en word embeddings. 23/12/2020 Bernardo Subercaseaux nos habl\u00f3 de su trabajo de investigaci\u00f3n acerca de formalizaciones de interpretabilidad de modelos de aprendizaje autom\u00e1tico desde el punto de vista de la complejidad computacional (slides, video ) 17/12/2020 Jorge Ortiz nos habl\u00f3 sobre la ling\u00fc\u00edstica s\u00edstemico funcional y sus potenciales v\u00ednculos con NLP. ( slides , video ) 02/12/2020: Mat\u00edas Rojas present\u00f3 su charla de Tesis I de mag\u00edster sobre nested NER en el Chilean Waiting List Corpus. 11/11/2020: Cristi\u00e1n Tamblay present\u00f3 su trabajo de memoria sobre transferencia de modelos de sentimiento y emoci\u00f3n en distintos dominios. 23/09/2020: Hern\u00e1n Sarmiento practic\u00f3 su charla de propuesta de tesis doctoral titulada: \"A Domain-independent and Multilingual Approach for Crisis Event Detection and Understanding\" 09/09/2020: Cristian Ahumada present\u00f3 su charla de Tesis I de mag\u00edster titulada: \"Dise\u00f1o y desarrollo de una infraestructura computacional b\u00e1sica para el aprendizaje del Mapuzugun\".( slides ) 12/08/2020: Javier Mu\u00f1oz present\u00f3 su charla de Tesis I de mag\u00edster sobre multi-instance multi-label text classification para educaci\u00f3n especial. 05/08/2020: Frank Zamora practiced for his PhD qualification exam. He presented his work on Semantic Change Detection and his survey on word representations. 20/05/2020: Gonzalo Mena nos habl\u00f3 sobre \"M\u00e9todos de estad\u00edstica computacional y machine learning para las ciencias de la vida, con una aplicaci\u00f3n a COVID-19.\" ( slides ). 04/03/2020: Carlos Castillo ( Chato ) nos habl\u00f3 sobre \"Fairness and Transparency in Rankings\" ( slides ). 16/03/2019: Jos\u00e9 Lezama de la Universidad de la Rep\u00fablica in Uruguay nos present\u00f3 su trabajo publicado en ICLR titulado: Revisiting non-linear PCA with progressively grown autoencoders. 15/03/2019: Daniel Diomedi nos habl\u00f3 sobre su tema de tesis de mag\u00edster: Improving Question Answering Systems over Wikidata. 27/11/2019: Andr\u00e9s Abeliuk (University of Southern California), nos habl\u00f3 sobre el impacto de los algoritmos en la sociedad. M\u00e1s info . 16/10/2019: Rollan Rodr\u00edguez nos habl\u00f3 sobre m\u00e9todos de clasificaci\u00f3n usando topolog\u00eda. 09/10/2019: Felipe Gonz\u00e1lez (alumno de la USM) nos present\u00f3 su trabajo sobre privacidad en el caso de Cambridge Analytica en Twitter. Su trabajo hace uso de word embeddings y open coding para encontrar asociaciones entre t\u00e9rminos. 02/10/2019: Jorge nos habl\u00f3 sobre dos papers de la familia de BERT que est\u00e1n en revisi\u00f3n en ICLR: 1) ELECTRA y 2) ALBERT . Idea interesante de ELECTRA: tener dos redes adversariales donde la primera genera oraciones corrompidas pero altamente probables (se reemplazan ciertas palabras por un muestreo de la salida de una softmax). Esto reemplaza la idea de hacer masking en BERT. La segunda red recibe las oraciones corrompidas de la primera y aprende a discriminar las palabras originales de las falsas (esto se hace con un sigmoide). Idea interesante de ALBERT: usar un embedding layer de menor dimensionalidad que se aumenta luego con una capa de proyecci\u00f3n. Esto reduce el n\u00famero de par\u00e1metros respecto a BERT. Adem\u00e1s se propone reemplazar la task de next sentence prediction por una que tome dos oraciones consecutivas, las desordene en algunos casos, y prediga si tienen el orden correcto. El argumento es que la tarea de next sentence prediction de BERT (que pone pares de oraciones aleatorias en los ejemplos negativos) es un muy simple. 25/09/2019: Wladmir Cardoso Brand\u00e3o present\u00f3 InferSent , una t\u00e9cnica para entrenar sentence embeddings usando datos de la Natural Language Inference task. 11/09/2019: Henry Rosales present\u00f3 su art\u00edculo publicado en EMNLP sobre Entity Linking. 04/09/2019: vimos la segunda parte del video de MultiTask Learning. Algunos conceptos interesantes: pointer networks (capas basadas en atenci\u00f3n para copiar partes del input), anti-curriculum training (aprender primero lo m\u00e1s d\u00edficil para evitar quedar en \u00f3ptimo local). 28/08/2019: Jorge di\u00f3 una clase sobre XLNet . Para llegar a XLNet hizo un repaso sobre Attention, Transformer y BERT . Cosas destacables sobre XLNet: relative positional encoding y permutation language models. Un blog post que trata de digerir esto aqu\u00ed . 21/08/2019: Daniel Aguirre present\u00f3 su charla de tesis I de mag\u00edster sobre Transformers para resolver tareas algor\u00edtmicas. 14/08/2019: Vimos este video sobre MultiTask learning de Richard Socher. Alcanzamos a ver la primera mitad. Lo paramos varias veces para procesarlo. La idea es usar QA como una tarea global donde se pueden instanciar muchas tareas de NLP (e.g., translation, entailment, sentiment analysis). M\u00e1s info en http://decanlp.com/ . Quedamos en retomar el video m\u00e1s adelante y leer el paper con m\u00e1s profundidad. 07/08/2019: Pablo Badilla present\u00f3 su propuesta de Tesis de Mag\u00edster sobre bias en Word Embeddings.","title":"Seminars"},{"location":"seminars/#minutas-in-spanish","text":"02/08/2023 Ricardo Baeza-Yates present\u00f3 su seminario titulado: Inteligencia Artificial Responsable ( video ). 10/07/2023 Mircea Petrache present\u00f3 su seminario titulado: Conformal Language Modeling ( slides ). 07/05/2023 Edison Marrese-Taylor present\u00f3 su seminario titulado: Learning to Represent Edits ( slides ). 31/05/2023 Ciclo de charlas ChatGPT: Panel de Discusi\u00f3n - Alcances y l\u00edmites de los modelos de lenguaje. Panelitas: Cristi\u00e1n Buc (CENIA), slides mini-presentaci\u00f3n. Magdalena Salda\u00f1a (UC/IMFD). Mart\u00edn C\u00e1ceres (MINEDUC). Felipe Tobar (IDIA Uchile, CMM). Moderador: Claudio Guti\u00e9rrez (DCC-IMFD). 24/05/2023 Ciclo de charlas ChatGPT en la Industria: posibilidades y proyecciones ( video ): Jorge Per\u00e9z present\u00f3 su seminario: IA sin far\u00e1ndula ( slides ). Manuel Pe\u00f1a present\u00f3 su seminario: GPT y Agentes, Como Conversar con tu App ( slides ). 17/05/2023 Ciclo de Charlas de ChatGPT: Gabriela Arriagada present\u00f3 su seminario, Desaf\u00edos \u00e9ticos actuales a la luz de la revoluci\u00f3n sociotecnol\u00f3gica del GPT3 y 4 ( slides )( video ). 10/05/2023 Ciclo de Charlas ChatGPT: Felipe Bravo present\u00f3 su seminario titulado, Un recorrido por los Modelos de Lenguaje: desde Shannon a GPT-4 ( slides )( video ). 04/05/2023 Ciclo de Charlas ChatGPT: Jorge Ortiz present\u00f3 su seminario titulado, \u00bfPuede ChatGPT conquistar el mundo? Lenguaje humano vs lenguaje de m\u00e1quina ( slides )( video ). 26/04/2023 Mauricio Araneda present\u00f3 su seminario titulado: MUSIB: Musical Score Inpainting Benchmark ( slides ). 19/04/2023 Felipe Urrutia present\u00f3 su seminario titulado: The Role of Natural Language Processing in Advancing Competency-Based Education and Mathematics Learning in Fourth Graders ( slides ) 12/04/2023 Gabriel Iturra present\u00f3 su charla de tesis II titulada: RiverText: A Framework for Training and Evaluating Incremental Word Embeddings from Text Data Streams ( slides )( v\u00eddeo ). 05/04/2023 Valentin Barriere present\u00f3 su seminario titulada: Multilingual Multi-target Stance Recognition in Online Public Consultations ( slides ) 29/03/2023 Jos\u00e9 Ca\u00f1ete present\u00f3 su charla de tesis II titulada: Light and Fast Language Models for Spanish Through Compression Techniques ( slides )( video ). 25/01/2023 Valentin Barriere present\u00f3 su seminario titulado: Two improvements for mutli-lingual in-context classification over tweets using transformers ( slides ). 18/01/2023 Presentaciones rel\u00e1mpago de los miembros de Relela ( slides ). 11/01/2023 Mircea Petrache present\u00f3 su seminario titulada: Word embeddings analogies and paraphrases: proofs and open problems ( slides ). 04/01/2023 Se realizo una reuni\u00f3n de coordinaci\u00f3n para futuras actividades Relela, donde se tomaron los siguientes acuerdos: Evento con presentaciones rel\u00e1mpagos sobre el tema que cada uno trabaja (2 minutos de presentaci\u00f3n con 1 diapositiva). Profesores de ReLeLa incorporar\u00e1n a sus estudiantes. Presentaci\u00f3n periodica de papers (semanal). Definir roles en el grupo. 21/12/2022 Se presentaron 2 charlas de Tesis I de mag\u00edster, 1) Clemente Henr\u00edquez: Evolution of topic and issues in Chilean news ( slides ), 2) Ignacio Meza: Benchmarking video action features for the video temporary sentence grounding task ( slides ). 14/12/2022 Jorge Ortiz present\u00f3 su charla de Tesis I de mag\u00edster titulada: \"Attitude Analysis: a linguistic-based task for detailed position detection in texts\" ( slides ). 07/12/2022 Mar\u00eda Jos\u00e9 Zambrano present\u00f3 su charla de Tesis I de mag\u00edster titulada: \"Comparison and Improvement of Bias Mitigation Algorithms for Word Embeddings\" ( slides ). 22/07/2022 Mauricio Araneda present\u00f3 su charla de Tesis II de mag\u00edster titulada: \"Computers making music? Measuring current progress with MUSIB evaluation\" ( slides ). 13/07/2022 Se presentaron 3 charlas de Tesis I de mag\u00edster, 1) Jos\u00e9 Espina: Marco de trabajo de calibraci\u00f3n r\u00e1pida de confianza, en toma de decisiones asistidas por IA, 2) Alfonso Valderrama : Entrop\u00eda de Shannon como medida de predictibilidad de sistemas de recomendaci\u00f3n, 3)Ignacio Nu\u00f1ez: Defining an extensible architecture for a multi-task GUI-oriented Machine Learning software. 22/06/2022 Juan Pablo Silva present\u00f3 su charla de Tesis II de mag\u00edster titulada: \"Logic-based interpretability of Graph Neural Networks\" 28/04/2022 Miguel Cordero del Servicio de Salud Metropolitano Sur Oriente de Santiago de Chile, nos present\u00f3 \"Tendencias de la salud mental en los primeros 20 a\u00f1os de vida de usuarios/as de servicios de salud en el sur oriente de Santiago: \u00bfqu\u00e9 podemos aprender de las notas medicas?\" 05/01/2022 Rolando Kindelan nos di\u00f3 una charla titulado \"An\u00e1lisis Topol\u00f3gico de Datos (TDA): antecedentes, actualidad y perspectivas\" 22/12/2021 El alumno de mag\u00edster Jos\u00e9 Ca\u00f1ete present\u00f3 su charla de tesis I: \"Efficient models for Spanish NLP through Knowledge Distillation\" ( slides )( video ) 15/12/2021 El alumno de mag\u00edster Mat\u00edas Rojas present\u00f3 su charla de tesis II titulada: Nested named entity recognition in diagnoses from the Chilean Waiting List in public hospitals ( slides ) 01/12/2021 Los alumnos de mag\u00edster Humberto Rodrigues y David Rojas presentaron sus charlas de Tesis I tituladas \"Exploring bias metric strategies in contextualized embeddings\" y \"Word Embedding Bias Origin Detection\". 19/11/2021 Javier Mu\u00f1oz present\u00f3 su trabajo de tesis de mag\u00edster: \"Aprendizaje multi-instancia multi-etiqueta en la recomendaci\u00f3n de intervenciones\" 29/09/2021 Cristian Ahumada present\u00f3 su trabajo: \"Dise\u00f1o y desarrollo de un software de apoyo para el aprendizaje del Mapuzugun\" 22/09/2021 Mauricio Araneda present\u00f3 un tutorial sobre VAEs. ( slides ) 01/09/2021 Pablo Badilla nos habl\u00f3 sobre su trabajo en el proyecto \"lxs 400 \" 07/07/2021 Los alumnos de mag\u00edster Basti\u00e1n Matamala, Mauricio Araneda y Gabriel Iturra presentaron sus charlas de Tesis I. 05/05/2021 Carolina Chiu habl\u00f3 sobre el testeo de word embeddings en el contexto cl\u00ednico. 21/04/2021 Cristi\u00e1n Candia (UDD) nos habl\u00f3 sobre su trabajo en \"Inteligencia Colectiva\". 14/04/2021 Gast\u00f3n L'huillier nos habl\u00f3 sobre Machine Learning Engineering, infraestructura y todos los desaf\u00edos de poner en modelos en producci\u00f3n. ( slides ) 24/03/2021 Andr\u00e9s Abeliuk present\u00f3 su l\u00ednea de investigaci\u00f3n en tema de polarizaci\u00f3n. 17/03/2021 Alan Ansell present\u00f3 su trabajo sobre PolyLM, un LM pol\u00edsemico ( video ) 29/01/2021 Felipe Bravo dio un tutorial introductorio a la inferencia Bayesiana. 20/01/2021 Daniel Diomedi present\u00f3 su charla de Tesis II sobre Question Answering sobre Wikidata usando Entity Linking and Neural Semantic Parsing. 13/01/2021 Javier Vera present\u00f3 su trabajo sobre Aproximaciones computacionales a la diversidad ling\u00fc\u00edstica de Sudam\u00e9rica (la charla fue grabada). 06/01/2021 Pablo Badilla present\u00f3 su trabajo sobre sesgo en word embeddings. 23/12/2020 Bernardo Subercaseaux nos habl\u00f3 de su trabajo de investigaci\u00f3n acerca de formalizaciones de interpretabilidad de modelos de aprendizaje autom\u00e1tico desde el punto de vista de la complejidad computacional (slides, video ) 17/12/2020 Jorge Ortiz nos habl\u00f3 sobre la ling\u00fc\u00edstica s\u00edstemico funcional y sus potenciales v\u00ednculos con NLP. ( slides , video ) 02/12/2020: Mat\u00edas Rojas present\u00f3 su charla de Tesis I de mag\u00edster sobre nested NER en el Chilean Waiting List Corpus. 11/11/2020: Cristi\u00e1n Tamblay present\u00f3 su trabajo de memoria sobre transferencia de modelos de sentimiento y emoci\u00f3n en distintos dominios. 23/09/2020: Hern\u00e1n Sarmiento practic\u00f3 su charla de propuesta de tesis doctoral titulada: \"A Domain-independent and Multilingual Approach for Crisis Event Detection and Understanding\" 09/09/2020: Cristian Ahumada present\u00f3 su charla de Tesis I de mag\u00edster titulada: \"Dise\u00f1o y desarrollo de una infraestructura computacional b\u00e1sica para el aprendizaje del Mapuzugun\".( slides ) 12/08/2020: Javier Mu\u00f1oz present\u00f3 su charla de Tesis I de mag\u00edster sobre multi-instance multi-label text classification para educaci\u00f3n especial. 05/08/2020: Frank Zamora practiced for his PhD qualification exam. He presented his work on Semantic Change Detection and his survey on word representations. 20/05/2020: Gonzalo Mena nos habl\u00f3 sobre \"M\u00e9todos de estad\u00edstica computacional y machine learning para las ciencias de la vida, con una aplicaci\u00f3n a COVID-19.\" ( slides ). 04/03/2020: Carlos Castillo ( Chato ) nos habl\u00f3 sobre \"Fairness and Transparency in Rankings\" ( slides ). 16/03/2019: Jos\u00e9 Lezama de la Universidad de la Rep\u00fablica in Uruguay nos present\u00f3 su trabajo publicado en ICLR titulado: Revisiting non-linear PCA with progressively grown autoencoders. 15/03/2019: Daniel Diomedi nos habl\u00f3 sobre su tema de tesis de mag\u00edster: Improving Question Answering Systems over Wikidata. 27/11/2019: Andr\u00e9s Abeliuk (University of Southern California), nos habl\u00f3 sobre el impacto de los algoritmos en la sociedad. M\u00e1s info . 16/10/2019: Rollan Rodr\u00edguez nos habl\u00f3 sobre m\u00e9todos de clasificaci\u00f3n usando topolog\u00eda. 09/10/2019: Felipe Gonz\u00e1lez (alumno de la USM) nos present\u00f3 su trabajo sobre privacidad en el caso de Cambridge Analytica en Twitter. Su trabajo hace uso de word embeddings y open coding para encontrar asociaciones entre t\u00e9rminos. 02/10/2019: Jorge nos habl\u00f3 sobre dos papers de la familia de BERT que est\u00e1n en revisi\u00f3n en ICLR: 1) ELECTRA y 2) ALBERT . Idea interesante de ELECTRA: tener dos redes adversariales donde la primera genera oraciones corrompidas pero altamente probables (se reemplazan ciertas palabras por un muestreo de la salida de una softmax). Esto reemplaza la idea de hacer masking en BERT. La segunda red recibe las oraciones corrompidas de la primera y aprende a discriminar las palabras originales de las falsas (esto se hace con un sigmoide). Idea interesante de ALBERT: usar un embedding layer de menor dimensionalidad que se aumenta luego con una capa de proyecci\u00f3n. Esto reduce el n\u00famero de par\u00e1metros respecto a BERT. Adem\u00e1s se propone reemplazar la task de next sentence prediction por una que tome dos oraciones consecutivas, las desordene en algunos casos, y prediga si tienen el orden correcto. El argumento es que la tarea de next sentence prediction de BERT (que pone pares de oraciones aleatorias en los ejemplos negativos) es un muy simple. 25/09/2019: Wladmir Cardoso Brand\u00e3o present\u00f3 InferSent , una t\u00e9cnica para entrenar sentence embeddings usando datos de la Natural Language Inference task. 11/09/2019: Henry Rosales present\u00f3 su art\u00edculo publicado en EMNLP sobre Entity Linking. 04/09/2019: vimos la segunda parte del video de MultiTask Learning. Algunos conceptos interesantes: pointer networks (capas basadas en atenci\u00f3n para copiar partes del input), anti-curriculum training (aprender primero lo m\u00e1s d\u00edficil para evitar quedar en \u00f3ptimo local). 28/08/2019: Jorge di\u00f3 una clase sobre XLNet . Para llegar a XLNet hizo un repaso sobre Attention, Transformer y BERT . Cosas destacables sobre XLNet: relative positional encoding y permutation language models. Un blog post que trata de digerir esto aqu\u00ed . 21/08/2019: Daniel Aguirre present\u00f3 su charla de tesis I de mag\u00edster sobre Transformers para resolver tareas algor\u00edtmicas. 14/08/2019: Vimos este video sobre MultiTask learning de Richard Socher. Alcanzamos a ver la primera mitad. Lo paramos varias veces para procesarlo. La idea es usar QA como una tarea global donde se pueden instanciar muchas tareas de NLP (e.g., translation, entailment, sentiment analysis). M\u00e1s info en http://decanlp.com/ . Quedamos en retomar el video m\u00e1s adelante y leer el paper con m\u00e1s profundidad. 07/08/2019: Pablo Badilla present\u00f3 su propuesta de Tesis de Mag\u00edster sobre bias en Word Embeddings.","title":"Minutas (In Spanish)"}]} \ No newline at end of file diff --git a/sitemap.xml b/sitemap.xml index a0bef93..d821a0a 100644 --- a/sitemap.xml +++ b/sitemap.xml @@ -2,27 +2,27 @@ None - 2023-08-05 + 2023-08-09 daily None - 2023-08-05 + 2023-08-09 daily None - 2023-08-05 + 2023-08-09 daily None - 2023-08-05 + 2023-08-09 daily None - 2023-08-05 + 2023-08-09 daily \ No newline at end of file diff --git a/sitemap.xml.gz b/sitemap.xml.gz index c93b552..c64ed9a 100644 Binary files a/sitemap.xml.gz and b/sitemap.xml.gz differ