April 23, 2026 – April 27, 2026

Microsoft at ICLR 2026

위치: Rio de Janeiro, Brazil

모든 시간은 CEST (UTC +2)

10:30 – 13:00 Poster session Pavilions 3 & 4

Poster Session 1
관련 출판물
- DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems
  
  Ming-Jie Ma, Jue Zhang, Fangkai Yang, Yu Kang, Qingwei Lin, S. Rajmohan, Dongmei Zhang
- villa-X: Enhancing Latent Action Modeling in Vision-Language-Action Models
  
  Xiaoyu Chen, Hangxing Wei, Pushi Zhang, Chuheng Zhang, Kaixin Wang, Yanjiang Guo, Rushuai Yang, Yucen Wang, Xinquan Xiao, Li Zhao, Jianyu Chen, Jiang Bian
- Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR
  
  Xiao Liang, Zhong-zhi Li, Yeyun Gong, Yelong Shen, Yingchun Wu, Zhijiang Guo, Weizhu Chen
- LLMs Get Lost In Multi-Turn Conversation
  
  Philippe Laban, Hiroaki Hayashi, Yingbo Zhou, Jennifer Neville
- MMedAgent-RL: Optimizing Multi-Agent Collaboration for Multimodal Medical Reasoning
  
  Peng Xia, Jinglu Wang, Yibo Peng, Kaide Zeng, Xian Wu, Xiangru Tang, Hongtu Zhu, Yun Li, Shujie Liu, Yan Lu, Huaxiu Yao
- SysMoBench: Evaluating AI on Formally Modeling Complex Real-World Systems
  
  Qian Cheng, Ruize Tang, Emilie Ma, Finn Hackett, Peiyang He, Yiming Su, Ivan Beschastnikh, Yu Huang, Xiaoxing Ma, Tianyin Xu
- Towards Efficient Optimizer Design for LLM via Structured Fisher Approximation with a Low-Rank Extension
  
  Wenbo Gong, Meyer Scetbon, Chao Ma, Edward Meeds
- Beyond Length: Quantifying Long-Range Information for Long-Context LLM Pretraining Data
  
  Haoran Deng, Yingyu Lin, Zhenghao Lin, Xiao Liu, Yizhou Sun, Yian Ma, Yeyun Gong
- Sequences of Logits Reveal the Low Rank Structure of Language Models
  
  Noah Golowich, Allen Liu, Abhishek Shetty
- Hyperspherical Latents Improve Continuous-Token Autoregressive Generation
  
  Guolin Ke, Hui Xue
- AdaReasoner: Dynamic Tool Orchestration for Iterative Visual Reasoning
  
  Mingyang Song, Haoyu Sun, Jiawei Gu, Linjie Li, Luxin Xu, Ranjay Krishna, Yu Cheng
- Text2Arch: A Dataset for Generating Scientific Architecture Diagrams from Natural Language Descriptions
  
  Shivank Garg, Sankalp Mittal, Manish Gupta
- GOT-Edit: Geometry-Aware Generic Object Tracking via Online Model Editing
  
  Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin
- Optimizing Agent Planning for Security and Autonomy
  
  Aashish Kolluri, Rishi Sharma, Manuel Costa, Boris Köpf, Tobias Niessen, Mark Russinovich, Shruti Tople, Santiago Zanella-Béguelin
- AdAEM: An Adaptively and Automated Extensible Measurement of LLMs' Value Difference
  
  Shitong Duan, Xiaoyuan Yi, Peng Zhang, Dongkuan Xu, Jing Yao, Tun Lu, Ning Gu, Xing Xie
- BiasBusters: Uncovering and Mitigating Tool Selection Bias in Large Language Models
  
  Thierry Blankenstein, Jialin Yu, Zixuan Li, Vassilis Plachouras, Sunando Sengupta, Philip H. S. Torr, Yarin Gal, Alasdair Paren, Adel Bibi
- EEPO: Exploration-Enhanced Policy Optimization via Sample-Then-Forget
  
  Liang Chen, Xueting Han, Qizhou Wang, Bo Han, Jing Bai, Hinrich Schutze, Kam-Fai Wong
- ReVeal: Self-Evolving Code Agents via Reliable Self-Verification
  
  Yiyang Jin, Kunzhao Xu, Hang Li, Xueting Han, Yanmin Zhou, Cheng Li, Jing Bai
- Learning to summarize user information for personalized reinforcement learning from human feedback
  
  Hyunji Nam, Yanming Wan, Mickel Liu, Peter Ahnn, Jianxun Lian, Natasha Jaques
10:42 Oral

Session 1B
관련 출판물
- Improving Diffusion Models for Class-imbalanced Training Data via Capacity Manipulation
  
  Feng Hong, Jiangchao Yao, Yifei Shen, Dongsheng Li, Ya Zhang, Yanfeng Wang
10:54 Oral

Session 1A
11:18 Oral

Session 1A
관련 출판물
- Revela: Dense Retriever Learning via Language Modeling
  
  Fengyu Cai, Tong Chen, Xinran Zhao, Sihao Chen, Hongming Zhang, Sherry Tongshuang Wu, Iryna Gurevych, Heinz Koeppl
15:15 – 17:45 Poster session Pavilions 3 & 4

Poster Session 2
관련 출판물
- Gistify! Codebase-Level Understanding via Runtime Execution
  
  Hyunji Lee, Minseon Kim, Chinmay Singh, Matheus Pereira, Atharv Sonwane, Isadora White, Elias Stengel-Eskin, Mohit Bansal, Zhengyan Shi, Alessandro Sordoni, Marc-Alexandre Côté, Xingdi Yuan, Lucas Caccia
- LLM Pretraining with Continuous Concepts
  
  Jihoon Tack, Jack Lanchantin, Jane Yu, Andrew Cohen, Ilia Kulikov, Janice Lan, Shibo Hao, Yuandong Tian, Jason Weston, Xian Li
- ProRe: A Proactive Reward System for GUI Agents via Reasoner-Actor Collaboration
  
  Gaole Dai, Shiqi Jiang, Ting Cao, Yuqing Yang, Yuanchun Li, Rui Tan, Mo Li, Lili Qiu
- VisCodex: Unified Multimodal Code Generation via Merging Vision and Coding Models
  
  Lingjie Jiang, Shaohan Huang, Xun Wu, Yixia Li, Dongdong Zhang, Furu Wei
- STITCH: Simultaneous Thinking and Talking with Chunked Reasoning for Spoken Language Models
  
  Cheng-Han Chiang, Xiaofei Wang, Linjie Li, Chung-Ching Lin, Kevin Lin, Shujie Liu, Zhendong Wang, Zhengyuan Yang, Hung-yi Lee, Lijuan Wang
- Characterizing Deep Research: A Benchmark and Formal Definition
  
  Abhinav Java, Ashmit Khandelwal, S. Midigeshi, Aaron L Halfaker, Amit Deshpande, Navin Goyal, Ankur Gupta, Nagarajan Natarajan, Amit Sharma
- Taming Imperfect Process Verifiers: A Sampling Perspective on Backtracking
  
  Dhruv Rohatgi, Abhishek Shetty, Donya Saless, Yuchen Li, Ankur Moitra, Andrej Risteski, Dylan Foster
- SwiReasoning: Switch-Thinking in Latent and Explicit for Pareto-Superior Reasoning LLMs
  
  Dachuan Shi, Abedelkadir Asi, Keying Li, Xiangchi Yuan, Leyan Pan, Wenke Lee, Wen Xiao
- Forward-Learned Discrete Diffusion: Learning how to noise to denoise faster
  
  Grigory Bartosh, Teodora Pandeva, Sushrut Karmalkar, Javier Zazo
- Actions Speak Louder than Prompts: A Large-Scale Study of LLMs for Graph Inference
  
  Ben Finkelshtein, Silviu Cucerzan, Sujay Kumar Jauhar, Ryen W. White
- Seeing Across Views: Benchmarking Spatial Reasoning of Vision-Language Models in Robotic Scenes
  
  Zhiyuan Feng, Zhaolu Kang, Qijie Wang, Zhiying Du, Jiongrui Yan, Shubin Shi, Chengbo Yuan, Huizhi Liang, Yu Deng, Qixiu Li, Rushuai Yang, Arctanx An, Leqi Zheng, Weijie Wang, Shawn Chen, Sicheng Xu, Yaobo Liang, Jiaolong Yang, Baining Guo
- VeriTrail: Closed-Domain Hallucination Detection with Traceability
  
  Dasha Metropolitansky, Jonathan Larson
- ELEPHANT: Measuring and understanding social sycophancy in LLMs
  
  Myra Cheng, Sunny Yu, Cinoo Lee, Pranav Khadpe, Lujain Ibrahim, Dan Jurafsky
- Just Do It!? Computer-Use Agents Exhibit Blind Goal-Directedness
  
  Erfan Shayegani, Keegan Hines, Yue Dong, Nael B. Abu-Ghazaleh, Roman Lutz, Spencer Whitehead, Vidhisha Balachandran, Besmira Nushi, Vibhav Vineet
- Exploring Interpretability for Visual Prompt Tuning with Hierarchical Concepts
  
  Yubin Wang, Xinyang Jiang, De Cheng, Xiangqian Zhao, Zilong Wang, Dongsheng Li, Cairong Zhao
- Benefits and Pitfalls of Reinforcement Learning for Language Model Planning: A Theoretical Perspective
  
  Siwei Wang, Yifei Shen, Haoran Sun, Shi Feng, Shang-Hua Teng, Li Dong, Yaru Hao, Wei Chen
- Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs
  
  Xumeng Wen, Zihan Liu, Shun Zheng, Zhijian Xu, Shengyu Ye, Zhirong Wu, Xiao Liang, Yang Wang, Junjie Li, Ziming Miao, Jiang Bian, Mao Yang
15:27 Oral

Session 2A
관련 출판물
- EmotionThinker: Prosody-Aware Reinforcement Learning for Explainable Speech Emotion Reasoning
  
  Dingdong Wang, Shujie Liu, Tianhua Zhang, Youjun Chen, Jinyu Li, Helen M. Meng
15:39 Oral

Session 2A
관련 출판물
- Token-Importance Guided Direct Preference Optimization
  
  Ning Yang, Hai Lin, Yibo Liu, Baoliang Tian, Guoqing Liu, Haijun Zhang
15:39 Oral

Session 2B
관련 출판물
- Sequences of Logits Reveal the Low Rank Structure of Language Models
  
  Noah Golowich, Allen Liu, Abhishek Shetty
15:39 Oral

Session 2D
관련 출판물
- LLMs Get Lost In Multi-Turn Conversation
  
  Philippe Laban, Hiroaki Hayashi, Yingbo Zhou, Jennifer Neville
16:15 Oral

Session 2A
관련 출판물
- LoongRL: Reinforcement Learning for Advanced Reasoning over Long Contexts
  
  Siyuan Wang, Gaokai Zhang, L. Zhang, Ning Shang, Fan Yang, Dongyao Chen, Mao Yang
16:15 Oral

Session 2B
관련 출판물
- The Coverage Principle: How Pre-Training Enables Post-Training
  
  Fan Chen, Audrey Huang, Noah Golowich, Sadhika Malladi, Adam Block, Jordan T. Ash, Akshay Krishnamurthy, Akshay Krishnamurthy, Dylan J. Foster
16:53 Oral

Session 2D
관련 출판물
- AdAEM: An Adaptively and Automated Extensible Measurement of LLMs' Value Difference
  
  Shitong Duan, Xiaoyuan Yi, Peng Zhang, Dongkuan Xu, Jing Yao, Tun Lu, Ning Gu, Xing Xie
22:54 Oral

Session 1D
관련 출판물
- Actions Speak Louder than Prompts: A Large-Scale Study of LLMs for Graph Inference
  
  Ben Finkelshtein, Silviu Cucerzan, Sujay Kumar Jauhar, Ryen W. White

10:30 – 13:00 Poster session Pavilions 3 & 4

Poster Session 3
관련 출판물
- TwinVLA: Data-Efficient Bimanual Manipulation with Twin Single-Arm Vision-Language-Action Models
  
  Hokyun Im, Euijin Jeong, Andrey Kolobov, Jianlong Fu, Youngwoon Lee
- EgoBrain: Synergizing Minds and Eyes For Human Action Understanding
  
  Nie Lin, Yansen Wang, Dongqi Han, Weibang Jiang, Jingyuan Li, Ryosuke Furuta, Yoichi Sato, Dongsheng Li
- When MLLMs Meet Compression Distortion: A Coding Paradigm Tailored to MLLMs
  
  Jinming Liu, Zhaoyang Jia, Jiahao Li, Bin Li, Xin Jin, Wenjun Zeng, Yan Lu
- YuE: Scaling Open Foundation Models for Long-Form Music Generation
  
  Ruibin Yuan, Hanfeng Lin, Shuyue Guo, Ge Zhang, Jiahao Pan, Yongyi Zang, Haohe Liu, Yiming Liang, Wenye Ma, Xingjian Du, Xinrun Du, Zhen Ye, Tianyu Zheng, Yi Ma, Minghao Liu, Zeyue Tian, Ziya Zhou, Liumeng Xue, Xingwei Qu, Yizhi Li, Shangda Wu, Tianhao Shen, Ziyang Ma, Junlin Zhan, Chunhui Wang, Yatian Wang, Xiao-Qian Chi, Xinyue Zhang, Zhen Yang, Xiangzhou Wang, Shan-Ling Liu, Ling Mei, Pengfei Li, Junjie Wang, Jianwei Yu, Guojian Pang, Xu Li, Zihao Wang, Xiaohuan Zhou, Lijun Yu, Emmanouil Benetos, Yong Chen, Cheng-Ju Lin, Xie Chen, Gus G. Xia, Zhaoxiang Zhang, Chao Zhang, Wenhu Chen, Xinyu Zhou, Xipeng Qiu, R. Dannenberg, Jia-Hua Liu, Jian Yang, Wenhao Huang, Wei Xue, Xu Tan, Yi-Ting Guo
- YoNoSplat: You Only Need One Model for Feedforward 3D Gaussian Splatting
  
  Botao Ye, Boqi Chen, Haofei Xu, Dániel Baráth, Marc Pollefeys
- VidGuard-R1: AI-Generated Video Detection and Explanation via Reasoning MLLMs and RL
  
  Kyoungjun Park, Yifan Yang, Juheon Yi, Shicheng Zheng, Yifei Shen, Dongqi Han, Caihua Shan, Muhammad Muaz, Lili Qiu
- Semantic Visual Anomaly Detection and Reasoning in AI-Generated Images
  
  Chuangchuang Tan, Xiang Ming, Jinglu Wang, Renshuai Tao, Bin Li, Yunchao Wei, Yao Zhao, Yan Lu
- Beyond Membership: Limitations of Add/Remove Adjacency in Differential Privacy
  
  Gauri Pradhan, Joonas Jälkö, Santiago Zanella-Béguelin, Antti Honkela
- Hey, That's My Model! Introducing Chain & Hash, An LLM Fingerprinting Technique
  
  Mark Russinovich, Ahmed Salem, Yanan Cai
- SEMA: Simple yet Effective Learning for Multi-Turn Jailbreak Attacks
  
  Mingqian Feng, Xiaodong Liu, Weiwei Yang, Jialin Song, Xuekai Zhu, Chenliang Xu, Jianfeng Gao
- Pretrain Value, Not Reward: Decoupled Value Policy Optimization
  
  Chenghua Huang, Lu Wang, Fangkai Yang, Pu Zhao, Zhixu Li, Qingwei Lin 林庆维, Dongmei Zhang, S. Rajmohan, Qi Zhang
- NI Sampling: Accelerating Discrete Diffusion Sampling by Token Order Optimization
  
  Enshu Liu, Xuefei Ning, Yu Wang, Zinan Lin
- The Markovian Thinker
  
  Milad Aghajohari, Kamran Chitsaz, Amirhossein Kazemnejad, Sarath Chandar, Alessandro Sordoni, Aaron C. Courville, Siva Reddy
11:30 Oral

Session 3B
관련 출판물
- VibeVoice: Expressive Podcast Generation with Next-Token Diffusion
  
  Zhiliang Peng, Jianwei Yu, Wenhui Wang, Yaoyao Chang, Yutao Sun, Li Dong, Yi Zhu, Weijiang Xu, Hangbo Bao, Zehua Wang, Shaohan Huang, Yan Xia, Furu Wei
15:15 – 17:45 Poster session Pavilions 3 & 4

Poster Session 4
관련 출판물
- PixelCraft: A Multi-Agent System for High-Fidelity Visual Reasoning on Structured Images
  
  Shuoshuo Zhang, Zijian Li, Yizhen Zhang, Jingjing Fu, Lei Song, Jiang Bian, Jun Zhang, Yujiu Yang, Rui Wang
- MetaMuse: Algorithm Generation via Creative Ideation
  
  Ruiying Ma, Chieh-Jan Mike Liang, Yanjie Gao, Francis Y. Yan
- Improving Code Localization with Repository Memory
  
  Boshi Wang, Weijian Xu, Yunsheng Li, Mei Gao, Yujia Xie, Huan Sun, Dongdong Chen
- How Far Are LLMs from Professional Poker Players? Revisiting Game-Theoretic Reasoning with Agentic Tool Use
  
  Min Lin, Enyan Dai, Hui Liu, Xianfeng Tang, Yuliang Yan, Zhenwei Dai, Jingying Zeng, Zhiwei Zhang, Fali Wang, Hongcheng Gao, Chen Luo, Xiang Zhang, Qianyu He, Suhang Wang
- SeerAttention-R: Sparse Attention Adaptation for Long Reasoning
  
  Yizhao Gao, Shuming Guo, Shijie Cao, Yuqing Xia, Yu Cheng, Lei Wang, Lingxiao Ma, Yutao Sun, Tianzhu Ye, Li Dong, Hayden Kwok-Hay So, Yu Hua, Ting Cao, Fan Yang, Mao Yang
- Do Not Let Low-Probability Tokens Over-Dominate in RL for LLMs
  
  Zhihe Yang, Xufang Luo, Zilong Wang, Dongqi Han, Zhiyuan He, Dongsheng Li, Yunjian Xu
- Understanding the Mixture-of-Experts with Nadaraya-Watson Kernel
  
  Chuanyang Zheng, Jiankai Sun, Yihang Gao, Enze Xie, Yuehao Wang, Peihao Wang, Ting Xu, Matthew Chang, Liliang Ren, Jingyao Li, Jing Xiong, Kashif Rasul, Mac Schwager, Anderson Schneider, Zhangyang Wang, Yuriy Nevmyvaka
- Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models
  
  Qizheng Zhang, Changran Hu, Shubhangi Upasani, Boyuan Ma, Fenglu Hong, V. Kamanuru, Jay Rainton, Chen Wu, Mengmeng Ji, Hanchen Li, Urmish Thakker, James Zou, K. Olukotun
- FilMaster: Bridging Cinematic Principles and Generative AI for Automated Film Generation
  
  Kaiyi Huang, Yukun Huang, Xintao Wang, Zinan Lin, Xuefei Ning, Pengfei Wan, Di Zhang, Yu Wang, Xihui Liu
- Welfarist Formulations for Diverse Similarity Search
  
  Siddharth Barman, Nirjhar Das, Shivam Gupta, Kiran Shiragur
- FlowRL: Matching Reward Distributions for LLM Reasoning
  
  Xuekai Zhu, Daixuan Cheng, Dinghuai Zhang, Hengli Li, Kaiyan Zhang, Che Jiang, Youbang Sun, Ermo Hua, Yuxin Zuo, Xingtai Lv, Qizheng Zhang, Lin Chen, Fanghao Shao, Bo Xue, Yunchong Song, Zhenjie Yang, Ganqu Cui, Ning Ding, Jianfeng Gao, Xiaodong Liu, Bowen Zhou, Hongyuan Mei, Zhouhan Lin
- Wavelet Predictive Representations for Non-Stationary Reinforcement Learning
  
  Min Wang, Xin Li, Ye He, Yao-Hui Li, Hasnaa Bennis, Riashat Islam, Mingzhong Wang

10:30 – 13:00 Poster session Pavilions 3 & 4

Poster Session 5
관련 출판물
- Flipping the Dialogue: Training and Evaluating User Language Models
  
  Tarek Naous, Philippe Laban, Wei Xu, Jennifer Neville
- Dyna-Mind: Learning to Simulate from Experience for Better AI Agents
  
  Xiao Yu, Baolin Peng, Michel Galley, Hao Cheng, Qianhui Wu, Janardhan Kulkarni, Suman Nath, Zhou Yu, Jianfeng Gao
- Trade in Minutes! Rationality-Driven Agentic System for Quantitative Financial Trading
  
  Zifan Song, Kaitao Song, Guosheng Hu, Ding Qi, Junyao Gao, Xiaohua Wang, Dongsheng Li, Cairong Zhao
- Sample More to Think Less: Group Filtered Policy Optimization for Concise Reasoning
  
  Vaishnavi Shrivastava, Ahmed Awadallah, Vidhisha Balachandran, Shivam Garg, Harkirat Behl, Dimitris Papailiopoulos
- Joint Distribution-Informed Shapley Values for Sparse Counterfactual Explanations
  
  Lei You, Yijun Bian, Lele Cao
- Riemannian Federated Learning via Averaging Gradient Stream
  
  Zhenwei Huang, Wen Huang, Pratik Jawanpuria, Bamdev Mishra
- COSMOS: A Hybrid Adaptive Optimizer for Memory-Efficient Training of LLMs
  
  Liming Liu, Zhenghao Xu, Zixuan Zhang, Hao Kang, Zichong Li, Chen Liang, Weizhu Chen, Tuo Zhao
- RePrompt: Reasoning-Augmented Reprompting for Text-to-Image Generation via Reinforcement Learning
  
  Ming-Kuan Wu, Lu Wang, Pu Zhao, Fangkai Yang, Jianjin Zhang, Jianfeng Liu, Yuefeng Zhan, Weihao Han, Hao Sun, Jiayi Ji, Xiaoshuai Sun, Qingwei Lin, Weiwei Deng, Dongmei Zhang, Feng Sun, Qi Zhang, Rongrong Ji
- EdiVal-Agent: An Object-Centric Framework for Automated, Fine-Grained Evaluation of Multi-Turn Editing
  
  Tianyu Chen, Yasi Zhang, Zhi Zhang, Peiyu Yu, Shu Wang, Zhendong Wang, K. Lin, Xiaofei Wang, Zhengyuan Yang, Linjie Li, Chung-Ching Lin, Jianwen Xie, Oscar Leong, Lijuan Wang, Y. Wu, Mingyuan Zhou
- Align to Misalign: Automatic LLM Jailbreak with Meta-Optimized LLM Judges
  
  Hamin Koo, Minseon Kim, Jaehyung Kim
- Temperature as a Meta-Policy: Adaptive Temperature in LLM Reinforcement Learning
  
  Haoran Dang, Cuiling Lan, Hai Wan, Xibin Zhao, Yan Lu
- Combinatorial Rising Bandits
  
  Seockbean Song, Youngsik Yoon, Siwei Wang, Wei Chen, Jungseul Ok
- Text2Grad: Reinforcement Learning from Natural Language Feedback
  
  Hanyang Wang, Lu Wang, Chaoyun Zhang, Tianjun Mao, Si Qin, Qingwei Lin 林庆维, Saravan Rajmohan, Dongmei Zhang
- RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation
  
  Jane Luo, Xin Zhang, Steven Liu, Jie Wu, Yiming Huang, Yangyu Huang, Chengyu Yin, Ying Xin, Jianfeng Liu, Yuefeng Zhan, Hao Sun, Qi Chen, Scarlett Li, Mao Yang
15:15 – 17:45 Poster session Pavilions 3 & 4

Poster Session 6
관련 출판물
- Generalization of RLVR Using Causal Reasoning as a Testbed
  
  Brian Lu, Hongyu Zhao, Shuo Sun, Hao Peng, Rui Ding, Hongyuan Mei
- UnLoc: Leveraging Depth Uncertainties for Floorplan Localization
  
  Matthias Wüest, Francis Engelmann, Ondrej Miksik, Marc Pollefeys, Dániel Baráth
- FlexiCodec: A Dynamic Neural Audio Codec for Low Frame Rates
  
  Jiaqi Li, Yao Qian, Yuxuan Hu, Leying Zhang, Xiaofei Wang, Heng Lu, Manthan Thakker, Jinyu Li, Sheng Zhao, Zhizheng Wu
- Learning to Generate Unit Test via Adversarial Reinforcement Learning
  
  Dongjun Lee, Changho Hwang, Kimin Lee
- AESCoder: Code Aesthetics with Agentic Reward Feedback
  
  Lingjie Jiang, Bang Xiao, Shaohan Huang, Tengchao Lv, Yupan Huang, Xun Wu, Lei Cui, Furu Wei
- SpaceControl: Introducing Test-Time Spatial Control to 3D Generative Modeling
  
  Elisabetta Fedele, Francis Engelmann, Ian Huang, O. Litany, Marc Pollefeys, Leonidas J. Guibas
- TrustGen: A Platform of Dynamic Benchmarking on the Trustworthiness of Generative Foundation Models
  
  TrustGen Team, Jianfeng Gao
- Understanding and Improving Shampoo and SOAP via Kullback-Leibler Minimization
  
  Wu Lin, Scott C. Lowe, Felix Dangel, Runa Eschenhagen, Zikun Xu, Roger B. Grosse
- WINA: Weight Informed Neuron Activation for Accelerating Large Language Model Inference
  
  Sihan Chen, Dan Zhao, Jongwoo Ko, Colby R. Banbury, Huiping Zhuang, Luming Liang, Tianyi Chen
- Holdout-Loss-Based Data Selection for LLM Finetuning via In-Context Learning
  
  Ling Zhang, Xianliang Yang, Juwon Yu, Park Cheonyoung, Lei Song, Jiang Bian
- Parallel Sampling from Masked Diffusion Models via Conditional Independence Testing
  
  Iskander Azangulov, Teodora Pandeva, Niranjani Prasad, Javier Zazo, Sushrut Karmalkar
- Is In-Context Learning Learning?
  
  Adrian de Wynter
- CodeSense: a Real-World Benchmark and Dataset for Code Semantic Reasoning
  
  Monoshi Kumar Roy, Simin Chen, Benjamin Steenhoek, Jinjun Peng, Gail E. Kaiser, Baishakhi Ray, Wei Le
- Harnessing Temporal Databases for Systematic Evaluation of Factual Time-Sensitive Question-Answering in Large Language Models
  
  Soyeon Kim, Jindong Wang, Xing Xie, Steven Euijong Whang
- Synergizing Understanding and Generation with Interleaved Analyzing-Drafting Thinking
  
  Shengqiong Wu, Bobo Li, Xinkai Wang, Xiangtai Li, Lei Cui, Furu Wei, Shuicheng YAN, Hao Fei, Tat-Seng Chua
- Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems
  
  Rishi Jha, Harold Triedman, Justin Wagle, Vitaly Shmatikov
- Tracing the Traces: Latent Temporal Signals for Efficient and Accurate Reasoning
  
  Martina G. Vilas, Safoora Yousefi, Besmira Nushi, Eric Horvitz, Vidhisha Balachandran
- Misaligned Roles, Misplaced Images: Structural Input Perturbations Expose Multimodal Alignment Blind Spots
  
  Erfan Shayegani, G. M. Shahariar, Sara Abdali, Lei Yu, Nael B. Abu-Ghazaleh, Yue Dong
- In-Context Compositional Q-Learning for Offline Reinforcement Learning
  
  Qiushui Xu, Yuhao Huang, Yushu Jiang, Lei Song, Jinyu Wang, Wenliang Zheng, Jiang Bian
- Representation-Based Exploration for Language Models: From Test-Time to Post-Training
  
  Jens Tuyls, Dylan Foster, Akshay Krishnamurthy, Jordan Ash
- Training Large Reasoning Models Efficiently via Progressive Thought Encoding
  
  Zeliang Zhang, Xiaodong Liu, Hao Cheng, Hao Sun, Chenliang Xu, Jianfeng Gao
- EvoTest: Evolutionary Test-Time Learning for Self-Improving Agentic Systems
  
  Yufei He, Juncheng Liu, Yue Liu, Yibo Li, Tri Cao, Zhiyuan Hu, Xinxing Xu, Bryan Hooi
- Geometric-Mean Policy Optimization
  
  Yuzhong Zhao, Yue Liu, Junpeng Liu, Jingye Chen, Xun Wu, Yaru Hao, Tengchao Lv, Shaohan Huang, Lei Cui, Qixiang Ye, Fang Wan, Furu Wei
- Score Distillation Beyond Acceleration: Generative Modeling from Corrupted Data
  
  Yasi Zhang, Tianyu Chen, Zhendong Wang, Yingnian Wu, Mingyuan Zhou, Oscar Leong
15:27 Oral

Session 6F
관련 출판물
- Quotient-Space Diffusion Model
  
  Yixian Xu, Yusong Wang, Shengjie Luo, Kaiyuan Gao, Tianyu He, Di He, Chang Liu

Microsoft at ICLR 2026

Thursday, April 23, 2026

Poster Session 1

Session 1B

Session 1A

Session 1A

Poster Session 2

Session 2A

Session 2A

Session 2B

Session 2D

Session 2A

Session 2B

Session 2D

Session 1D

Friday, April 24, 2026

Poster Session 3

Session 3B

Poster Session 4

Saturday, April 25, 2026

Poster Session 5

Poster Session 6

Session 6F