Accepted Demo Papers

TOPICAL: TOPIC Pages AutomagicaLly - John Michael Giorgi, Amanpreet Singh, Doug Downey, Sergey Feldman, Lucy Lu Wang
Low-code LLM: Graphical User Interface over Large Language Models - Yuzhe Cai, Shaoguang Mao, Wenshan Wu, Zehua Wang, Yaobo Liang, Tao Ge, Chenfei Wu, WangYou, Ting Song, Yan Xia, Nan Duan, Furu Wei
EdTec-QBuilder: A Semantic Retrieval Tool for Assembling Vocational Training Exams in German Language - Alonso Palomino, Andreas Fischer, Jakub Kuzilek, Jarek Nitsch, Niels Pinkwart, Benjamin Paassen
DIALIGHT: Lightweight Multilingual Development and Evaluation of Task-Oriented Dialogue Systems with Large Language Models - Songbo Hu, Xiaobin Wang, Moy Yuan, Anna Korhonen, Ivan Vulić
RTSUM: Relation Triple-based Interpretable Summarization with Multi-level Salience Visualization - Seonglae Cho, Myungha Jang, Jinyoung Yeo, Dongha Lee
Edu-ConvoKit: An Open-Source Library for Education Conversation Data - Rose E Wang, Dorottya Demszky
jp-evalb: Robust Alignment-based PARSEVAL Measures - Jungyeul Park, Junrui Wang, Eunkyul Leah Jo, Angela Yoonseo Park
OpinionGPT: Modelling Explicit Biases in Instruction-Tuned LLMs - Patrick Haller, Ansar Aynetdinov, Alan Akbik
ATLAS: A System for PDF-centric Human Interaction Data Collection - Alexa Siu, Zichao Wang, Joshua Hoeflich, Naman Kapasi, Ani Nenkova, Tong Sun
BeLeaf: Belief Prediction as Tree Generation - John Murzaku, Owen Rambow
QueryExplorer: An Interactive Query Generation Assistant for Search and Exploration - Kaustubh Dhole, Shivam Bajaj, Ramraj Chandradevan, Eugene Agichtein
LMFlow: An Extensible Toolkit for Finetuning and Inference of Large Foundation Models - Shizhe Diao, Rui Pan, Hanze Dong, KaShun SHUM, Jipeng Zhang, Wei Xiong, Tong Zhang
DOCMASTER: A Unified Platform for Annotation, Training, & Inference in Document Question-Answering - Alex Nguyen, Zilong Wang, Jingbo Shang, Dheeraj Mekala
RedCoast: A Lightweight Tool to Automate Distributed Training of LLMs on Any GPU/TPUs - Bowen Tan, Yun Zhu, Lijuan Liu, Hongyi Wang, Yonghao Zhuang, Jindong Chen, Eric P. Xing, Zhiting Hu
Concept Over Time Analysis: Unveiling Temporal Patterns for Qualitative Data Analysis - Tim Fischer, Florian Schneider, Robert Geislinger, Florian Helfer, Gertraud Koch, Chris Biemann
pyvene: A Library for Understanding and Improving PyTorch Models via Interventions - Zhengxuan Wu, Atticus Geiger, Aryaman Arora, Jing Huang, Zheng Wang, Noah Goodman, Christopher D Manning, Christopher Potts
Newspaper Signaling for Crisis Prediction - Prajvi Saxena, Sabine Janzen, Wolfgang Maass
FastFit: Fast and Effective Few-Shot Text Classification with a Multitude of Classes - Asaf Yehudai, Elron Bandel
AgentQuest: A Modular Benchmark Framework to Measure Progress and Improve LLM Agents - Luca Gioacchini, Giuseppe Siracusano, Davide Sanvito, Kiril Gashteovski, David Friede, Roberto Bifulco, Carolin Lawrence
ZhuJiu-Knowledge: A Fairer Platform for Evaluating Multiple Knowledge Types in Large Language Models - Pengfan DU, Sirui Liang, Baoli Zhang, Pengfei Cao, Yubo Chen, Kang Liu, Jun Zhao
Unitxt: Flexible, Shareable and Reusable Data Preparation and Evaluation for Generative AI - Elron Bandel, Yotam Perlitz, Elad Venezian, Roni Friedman, Ofir Arviv, Matan Orbach, Shachar Don-Yehiya, Dafna Sheinwald, Ariel Gera, Leshem Choshen, Michal Shmueli-Scheuer, Yoav Katz

Share on

Twitter Facebook LinkedIn