Chetan Bansal

Senior Principal Research Manager

Publications

View by:

- Serving Models, Fast and Slow:Optimizing Heterogeneous LLM Inferencing Workloads at Scale
  
  Kunal Jain, A. Parayil, Ankur Mallick, Rujia Wang, Renee St. Amant, Chetan Bansal, Victor Ruehle, Saravan Rajmohan, Shashwat Jaiswal, Yogesh Simmhan, Anoop Kulkarni, Steve Kofsky
  
  ACM Sigmetrics 2026 | June 2026
  
  Publication Project
- Continuous Benchmark Generation for Evaluating Enterprise-scale LLM Agents
  
  Divyanshu Saxena, Rishikesh Maurya, Xiaoxuan Ou, Gagan Somashekar, Shachee Mishra Gupta, Arun Iyer, Yu Kang, Chetan Bansal, Aditya Akella, Saravan Rajmohan
  
  International Conference on Software Engineering Workshop on Large Language Models for Code | April 2026
  
  DOI Publication Publication
- AutoAdapt: An Automated Domain Adaptation Framework for LLMs
  
  Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan
  
  March 2026
  
  Publication
- Memora: A Harmonic Memory Representation Balancing Abstraction and Specificity
  
  Menglin Xia, Xuchao Zhang, Shantanu Dixit, Paramaguru Harimurugan, Rujia Wang, Victor Ruehle, Robert Sim, Chetan Bansal, Saravan Rajmohan
  
  March 2026
  
  Preprint
- AgentRx: Diagnosing AI Agent Failures from Execution Trajectories
  
  Shraddha Barke, Arnav Goyal, Alind Khare, Avaljot Singh, Suman Nath, Chetan Bansal
  
  February 2026
  
  Preprint
- SUTRADHARA : An Intelligent Orchestrator-Engine Co-design for Tool-based Agentic Inference
  
  Anish Biswas, Kanishk Goel, Jayashree Mohan, Alind Khare, A. Parayil, Ramachandran Ramjee, Chetan Bansal
  
  February 2026
  
  Preprint Project
- Workload Intelligence: Workload-Aware IaaS Abstraction for Cloud Efficiency
  
  Lexiang Huang, A. Parayil, Jue Zhang, Xiaoting Qin, Chetan Bansal, Jovan Stojkovic, Pantea Zardoshti, Pulkit Misra, Eli Cortez, Raphael Ghelman, Íñigo Goiri, Saravan Rajmohan, Jim Kleewein, Rodrigo Fonseca, Timothy Zhu, Ricardo Bianchini
  
  International Conference for High Performance Computing, Networking, Storage, and Analysis (SC) | November 2025
  
  Publication
- ModServe: Modality- and Stage-Aware Resource Disaggregation for Scalable Multimodal Model Serving
  
  Haoran Qiu, Anish Biswas, Zihan Zhao, Jayashree Mohan, Alind Khare, Esha Choukse, Íñigo Goiri, Zeyu Zhang, Haiying Shen, Chetan Bansal, Ramachandran Ramjee, Rodrigo Fonseca
  
  ACM Symposium on Cloud Computing (SoCC) 2025 | November 2025
  
  Preprint Project Project
- Adapting Web Agents with Synthetic Supervision
  
  Zhaoyang Wang, Yiming Liang, Xuchao Zhang, Qianhui Wu, Siwei Han, Anson Bastos, Rujia Wang, Chetan Bansal, Baolin Peng, Jianfeng Gao, Saravan Rajmohan, Huaxiu Yao
  
  November 2025
  
  Publication Project
- Generative Caching for Structurally Similar Prompts and Responses
  
  Sarthak Chakraborty, Suman Nath, Xuchao Zhang, Chetan Bansal, Indranil Gupta
  
  NeurIPS 2025 | November 2025
  
  Preprint
- Triangle: Empowering Incident Triage with Multi-Agent
  
  Zhaoyang Yu, Aoyang Fang, Minghua Ma, Chaoyun Zhang, Ze Li, Murali Chintalapati, Xuchao Zhang, Rujia Wang, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, et.al
  
  ASE'25 | November 2025
  
  Publication Project
- Attention Enhanced Entity Recommendation for Intelligent Monitoring in Cloud Systems
  
  Fiza Hussain, Anson Bastos, A. Parayil, Ayush Choure, Chetan Bansal, Rujia Wang, Saravan Rajmohan
  
  October 2025
  
  Publication
- REFA: Reference Free Alignment for multi-preference optimization
  
  Taneesh Gupta, Rahul Madhavan, Xuchao Zhang, Chetan Bansal, Saravan Rajmohan
  
  COLM 2025 | July 2025
  
  Publication
- AIOpsLab: A Holistic Framework for Evaluating AI Agents for Enabling Autonomous Cloud
  
  Yinfang Chen, Manish Shetty, Gagan Somashekar, Minghua Ma, Yogesh Simmhan, Jonathan Mace, Chetan Bansal, Rujia Wang, Saravan Rajmohan
  
  MLSys '25 | May 2025
  
  Publication
- ProtoRAIL: A Risk-cognizant Imitation Agent for Adaptive vCPU Oversubscription In The Cloud
  
  Lu Wang, Mayukh Das, Fangkai Yang, Bo Qiao, Hang Dong, Si Qin, Victor Ruehle, Chetan Bansal, Eli Cortez, Íñigo Goiri, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  MLSys'25 | May 2025
  
  Publication
- Towards Cloud Efficiency with Large-scale Workload Characterization
  
  A. Parayil, Jue Zhang, Xiaoting Qin, Íñigo Goiri, Chetan Bansal
  
  ICPE | May 2025
  
  Preprint
- Automated Service Design with Cerulean (Project Showcase)
  
  Vaastav Anand, Alok Kumbhare, Celine Irvene, Chetan Bansal, Gagan Somashekar, Jonathan Mace, Pedro Las-Casas, Ricardo Bianchini, Rodrigo Fonseca
  
  2025 IEEE/ACM International Workshop on Cloud Intelligence & AIOps (AIOps) | May 2025, pp. 1-3
  
  DOI Publication
- Time Warp: The Gap Between Developers’ Ideal vs Actual Workweeks in an AI-Driven Era
  
  Sukrit Kumar, Drishti Goel, Tom Zimmermann, Brian Houck, B. Ashok, Chetan Bansal
  
  ICSE SEIP '25 | April 2025
  
  Distinguished Paper Award
  
  Preprint
- Synergistic Weak-Strong Collaboration by Aligning Preferences
  
  Yizhu Jiao, Xuchao Zhang, Zhaoyang Wang, Yubo Ma, Zhun Deng, Rujia Wang, Chetan Bansal, Saravan Rajmohan, Jiawei Han, Huaxiu Yao
  
  ArXiv | April 2025, Vol abs/2504.15188
  
  DOI Publication Publication
- Performance Aware LLM Load Balancer for Mixed Workloads
  
  Kunal Jain, A. Parayil, Ankur Mallick, Esha Choukse, Xiaoting Qin, Jue Zhang, Íñigo Goiri, Rujia Wang, Chetan Bansal, Victor Ruehle, Anoop Kulkarni, Steve Kofsky, Saravan Rajmohan
  
  EuroMLSys 2025 | April 2025
  
  Publication Project
- Coach: Exploiting Temporal Patterns for All-Resource Oversubscription in Cloud Platforms
  
  Benjamin Reidys, Pantea Zardoshti, Íñigo Goiri, Celine Irvene, Daniel S. Berger, Haoran Ma, Kapil Arya, Taylor Stark, Eugene Bak, Mehmet Iyigun, Stanko Novakovic, Lisa Hsu, Karel Trueba, Abhisek Pan, Chetan Bansal, Saravan Rajmohan, Jian Huang, Ricardo Bianchini
  
  ASPLOS | March 2025
  
  Publication Project
- Anyprefer: An Agentic Framework for Preference Data Synthesis
  
  Yiyang Zhou, Zhaoyang Wang, Tianle Wang, Shangyu Xing, Peng Xia, Bo Li, Kaiyuan Zheng, Zijian Zhang, Zhaorun Chen, Wenhao Zheng, Xuchao Zhang, Chetan Bansal, Weitong Zhang, Ying Wei, Mohit Bansal, Huaxiu Yao
  
  ICLR 2025 | March 2025
  
  Publication PDF
- AMPO: Active Multi-Preference Optimization
  
  Taneesh Gupta, Rahul Madhavan, Xuchao Zhang, Chetan Bansal, Saravan Rajmohan
  
  ICML 2025 | February 2025
  
  DOI Publication Publication
- Intent-based System Design and Operation
  
  Vaastav Anand, Yichen Li, Alok Kumbhare, Celine Irvene, Chetan Bansal, Gagan Somashekar, Jonathan Mace, Pedro Las-Casas, Ricardo Bianchini, Rodrigo Fonseca
  
  Proceedings of the 4th Workshop on Practical Adoption Challenges of ML for Systems | February 2025
  
  DOI Publication Publication
- Verifiable Format Control for Large Language Model Generations
  
  Zhaoyang Wang, Jinqi Jiang, Huichi Zhou, Wenhao Zheng, Xuchao Zhang, Chetan Bansal, Huaxiu Yao
  
  NAACL | February 2025
  
  DOI Publication Publication
- ModServe: Scalable and Resource-Efficient Large Multimodal Model Serving
  
  Haoran Qiu, Anish Biswas, Zihan Zhao, Jayashree Mohan, Alind Khare, Esha Choukse, Íñigo Goiri, Zeyu Zhang, Haiying Shen, Chetan Bansal, Ramachandran Ramjee, Rodrigo Fonseca
  
  February 2025
  
  Publication Project Project
- Ensuring Fair LLM Serving Amid Diverse Applications
  
  Kunal Jain, Ankur Mallick, A. Parayil, Renee St. Amant, Rujia Wang, Victor Ruehle, Chetan Bansal, Saravan Rajmohan, Redwan Ibne Seraj Khan, Haiying Shen, Anoop Kulkarni, Steve Kofsky, Pankhuri Choudhary, Yue Cheng
  
  ArXiv | November 2024
  
  Publication Project
- Building AI Agents for Autonomous Clouds: Challenges and Design Principles
  
  Manisha M Shetty, Yinfang Chen, Gagan Somashekar, Minghua Ma, Yogesh L. Simmhan, Xuchao Zhang, Jonathan Mace, Pedro Las-Casas, Shachee Mishra Gupta, Suman Nath, Chetan Bansal, Saravan Rajmohan
  
  2024 Symposium on Cloud Computing | November 2024
  
  Publication
- CARMO: Dynamic Criteria Generation for Context-Aware Reward Modelling
  
  Taneesh Gupta, Shivam Shandilya, Xuchao Zhang, Supriyo Ghosh, Chetan Bansal, Huaxiu Yao, Saravan Rajmohan
  
  2024 Meeting of the Association for Computational Linguistics | October 2024
  
  Publication
- CREAM: Consistency Regularized Self-Rewarding Language Models
  
  Zhaoyang Wang, Weilei He, Zhiyuan Liang, Xuchao Zhang, Chetan Bansal, Ying Wei, Weitong Zhang, Huaxiu Yao
  
  ICLR 2025 | October 2024
  
  DOI Publication Publication
- Can We Trust Auto-Mitigation? Improving Cloud Failure Prediction with Uncertain Positive Learning
  
  Haozhe Li, Minghua Ma, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  2024 International Symposium on Software Reliability Engineering | October 2024
  
  Publication
- COIN: Chance-Constrained Imitation Learning for Safe and Adaptive Resource Oversubscription under Uncertainty
  
  Lu Wang, Mayukh Das, Fangkai Yang, Chao Du, Bo Qiao, Hang Dong, Chetan Bansal, Si Qin, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang, Qi Zhang
  
  CIKM'24 | October 2024
  
  PDF
- Early Bird: Ensuring Reliability of Cloud Systems Through Early Failure Prediction
  
  Yudong Liu, Minghua Ma, Pu Zhao, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  2024 International Symposium on Software Reliability Engineering | October 2024
  
  Publication
- FLASH: A Workflow Automation Agent for Diagnosing Recurring Incidents
  
  Xuchao Zhang, Tanish Mittal, Chetan Bansal, Rujia Wang, Minghua Ma, Zhixin Ren, Hao Huang, Saravan Rajmohan
  
  October 2024
  
  Publication Project
- Intelligent Router for LLM Workloads: Improving Performance Through Workload-Aware Scheduling
  
  A. Parayil, Ankur Mallick, Esha Choukse, Xiaoting Qin, Jue Zhang, Íñigo Goiri, Rujia Wang, Chetan Bansal, Victor Ruehle, Saravan Rajmohan, Kunal Jain, Anoop Kulkarni, Steve Kofsky
  
  ArXiv | August 2024, Vol abs/2408.13510
  
  Preprint
- Large Language Models Can Provide Accurate and Interpretable Incident Triage
  
  Zexin Wang, Minghua Ma, Ze Li, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  2024 International Symposium on Software Reliability Engineering | August 2024
  
  Publication
- Automated Root Causing of Cloud Incidents using In-Context Learning with GPT-4
  
  Xuchao Zhang, Supriyo GHOSH, Chetan Bansal, Rujia Wang, Minghua Ma, Yu Kang, Saravan Rajmohan
  
  Foundations of Software Engineering (FSE) | July 2024
  
  Publication
- X-lifecycle Learning for Cloud Incident Management using LLMs
  
  Drishti Goel, Fiza Husain, Aditya Singh, Supriyo GHOSH, A. Parayil, Chetan Bansal, Xuchao Zhang, Saravan Rajmohan
  
  Foundations of Software Engineering (FSE) | July 2024
  
  Publication
- MonitorAssistant: Simplifying Cloud Service Monitoring via Large Language Models
  
  Zhaoyang Yu, Minghua Ma, Chaoyun Zhang, Si Qin, Yu Kang, Chetan Bansal, Saravan Rajmohan, Yingnong Dang, Changhua Pei, Dan Pei, Qingwei Lin 林庆维, Dongmei Zhang
  
  Foundations of Software Engineering (FSE) | July 2024
  
  DOI Publication
- Exploring LLM-based Agents for Root Cause Analysis
  
  Devjeet Roy, Xuchao Zhang, Rashi Bhave, Chetan Bansal, Pedro Las-Casas, Rodrigo Fonseca, Saravan Rajmohan
  
  FSE '24: 32nd ACM International Conference on the Foundations of Software Engineering | July 2024
  
  Publication Project
- MonitorAssistant: Simplifying Cloud Service Monitoring via Large Language Models
  
  Zhaoyang Yu, Minghua Ma, Chaoyun Zhang, Si Qin, Yu Kang, Chetan Bansal, Saravan Rajmohan, Yingnong Dang, Changhua Pei, Dan Pei, Qingwei Lin 林庆维, Dongmei Zhang
  
  ESEC/FSE'24 Industry Track | July 2024
  
  Publication Publication
- CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models
  
  Peng Xia, Ze Chen, Juanxi Tian, Yangrui Gong, Ruibo Hou, Yue Xu, Zhenbang Wu, Zhiyuan Fan, Yiyang Zhou, Kangyu Zhu, Wenhao Zheng, Zhaoyang Wang, Xiao Wang, Xuchao Zhang, Chetan Bansal, Marc Niethammer, Junzhou Huang, Hongtu Zhu, Yun Li, Jimeng Sun, Zongyuan Ge, Gang Li, James Zou, Huaxiu Yao
  
  NeurIPS 2024 | June 2024
  
  DOI Publication Publication
- Designing Cloud Servers for Lower Carbon
  
  Jaylen Wang, Daniel S. Berger, Fiodar Kazhamiaka, Celine Irvene, Chaojie Zhang, Esha Choukse, Kali Frost, Rodrigo Fonseca, Brijesh Warrier, Chetan Bansal, Jonathan Stern, Ricardo Bianchini, Akshitha Sriraman
  
  ISCA | June 2024
  
  Publication
- SmartOClock: Workload- and Risk-Aware Overclocking in the Cloud
  
  Jovan Stojkovic, Pulkit Misra, Íñigo Goiri, Sam Whitlock, Esha Choukse, Mayukh Das, Chetan Bansal, Jason Lee, Zoey Sun, Haoran Qiu, Reed Zimmermann, Savyasachi Samal, Brijesh Warrier, Ashish Raniwala, Ricardo Bianchini
  
  ISCA | June 2024
  
  Publication
- Dependency Aware Incident Linking in Large Cloud Systems
  
  Supriyo GHOSH, Karish Grover, Jimmy Wong, Chetan Bansal, Rakesh Namineni, Mohit Verma, Saravan Rajmohan
  
  The Web Conference (WWW) | May 2024
  
  Publication
- Intelligent Overclocking for Improved Cloud Efficiency
  
  Aditya Soni, Mayukh Das, Pulkit Misra, Chetan Bansal
  
  AIOps '24 workshop @ ASPLOS [5th International Workshop on Cloud Intelligence / AIOps] | April 2024
  
  Preprint
- Intelligent Monitoring Framework for Cloud Services: A Data-Driven Approach
  
  Pooja Srinivas, Fiza Husain, A. Parayil, Ayush Choure, Chetan Bansal, Saravan Rajmohan
  
  46th International Conference on Software Engineering: Software Engineering in Practice (ICSE-SEIP’24) | April 2024
  
  Preprint
- Workload Intelligence: Punching Holes Through the Cloud Abstraction
  
  Lexiang Huang, A. Parayil, Jue Zhang, Xiaoting Qin, Chetan Bansal, Jovan Stojkovic, Pantea Zardoshti, Pulkit Misra, Eli Cortez, Raphael Ghelman, Íñigo Goiri, Saravan Rajmohan, Jim Kleewein, Rodrigo Fonseca, Timothy Zhu, Ricardo Bianchini
  
  ArXiv | April 2024, Vol abs/2404.19143
  
  Preprint
- Workload Intelligence: Punching Holes Through the Cloud Abstraction
  
  Lexiang Huang, A. Parayil, Jue Zhang, Xiaoting Qin, Chetan Bansal, Jovan Stojkovic, Pantea Zardoshti, Pulkit Misra, Eli Cortez, Raphael Ghelman, Íñigo Goiri, Saravan Rajmohan, Jim Kleewein, Rodrigo Fonseca, Timothy Zhu, Ricardo Bianchini
  
  April 2024
  
  Preprint
- PACE-LM: Prompting and Augmentation for Calibrated Confidence Estimation with GPT-4 in Cloud Incident Root Cause Analysis
  
  Dylan Zhang, Xuchao Zhang, Chetan Bansal, Pedro Las-Casas, Rodrigo Fonseca, Saravan Rajmohan
  
  September 2023
  
  Publication
- AutoARTS: Taxonomy, Insights and Tools for Root Cause Labelling of Incidents in Microsoft Azure
  
  Pradeep Dogga, Chetan Bansal, Richard Costleigh, Gopinath Jayagopal, Suman Nath, Xuchao Zhang
  
  2023 USENIX Annual Technical Conference | July 2023
  
  Publication Project
- How Different are the Cloud Workloads? Characterizing Large-Scale Private and Public Cloud Workloads
  
  Xiaoting Qin, Minghua Ma, Yueng Zhao, Jue Zhang, Chao Du, Yudong Liu, A. Parayil, Chetan Bansal, Saravan Rajmohan, Íñigo Goiri, Eli Cortez, Si Qin, Qingwei Lin 林庆维, Dongmei Zhang
  
  DSN'23 | June 2023
  
  Publication
- Recommending Root-Cause and Mitigation Steps for Cloud Incidents using Large Language Models
  
  Toufique Ahmed, Supriyo GHOSH, Chetan Bansal, Tom Zimmermann, Xuchao Zhang, Saravan Rajmohan
  
  ICSE 2023 | May 2023
  
  Publication
- Snape: Reliable and Low-Cost Computing with Mixture of Spot and On-Demand VMs
  
  Fangkai Yang, Lu Wang, Zhenyu Xu, Jue Zhang, Liqun Li, Bo Qiao, Camille Couturier, Chetan Bansal, Soumya Ram, Si Qin, Zhen Ma, Íñigo Goiri, Eli Cortez, Terry Yang, Victor Ruehle, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  ASPLOS'23 | March 2023
  
  Publication
- AutoTSG: Learning and Synthesis for Incident Troubleshooting
  
  Manish Shetty, Chetan Bansal, Sai Pramod Upadhyayula, Arjun Radhakrishna, Anurag Gupta
  
  ESEC/FSE 2022 | November 2022
  
  Publication Publication Publication
- How to Fight Production Incidents? An Empirical Study on a Large-scale Cloud Service
  
  Supriyo GHOSH, Manish Shetty, Chetan Bansal, Suman Nath
  
  SoCC 2022 | November 2022
  
  Best Paper Award
  
  Publication PDF Project
- Characterizing the Usage of CI Tools in ML Projects
  
  Dhia Elhaq Rzig, Foyzul Hassan, Chetan Bansal, Nachiappan Nagappan
  
  ESEM 2022 | September 2022
  
  Publication
- DeepAnalyze: Learning to Localize Crashes at Scale
  
  Manish Shetty, Chetan Bansal, Suman Nath, Sean Bowles, Henry Wang, Ozgur Arman, Siamak Ahari
  
  ICSE 2022 | May 2022
  
  Publication Project
- SoftNER: Mining knowledge graphs from Cloud Incidents
  
  Manish Shetty, Chetan Bansal, Sumit Kumar, Nikitha Rao, Nachiappan Nagappan
  
  Empirical Software Engineering | April 2022, Vol 27(4)
  
  Publication
- Spot Virtual Machine Eviction Prediction in Microsoft Cloud
  
  Fangkai Yang, Bowen Pang, Jue Zhang, Bo Qiao, Lu Wang, Camille Couturier, Chetan Bansal, Soumya Ram, Si Qin, Zhen Ma, Íñigo Goiri, Eli Cortez, Senthil Baladhandayutham, Victor Rühle, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  WWW'22 Companion | April 2022
  
  Publication
- Micro-climate Prediction – Multi Scale Encoder-decoder based Deep Learning Framework
  
  Peeyush Kumar, Ranveer Chandra, Chetan Bansal, Shivkumar Kalyanaraman, Tanuja Ganu, Michael Grant
  
  2021 Knowledge Discovery and Data Mining | August 2021
  
  Publication Publication Project Project
- Neural Knowledge Extraction From Cloud Service Incidents
  
  Manish Shetty, Chetan Bansal, Sumit Kumar, Nikitha Rao, Nachiappan Nagappan, Tom Zimmermann
  
  43rd International Conference on Software Engineering (ICSE '21) - SEIP Track | May 2021
- Search4Code: Code Search Intent Classification Using Weak Supervision
  
  Nikitha Rao, Chetan Bansal, Joe Guan
  
  Mining Software Repositories (MSR '21) | May 2021
  
  PDF
- Large-Scale Intent Analysis for Identifying Large-Review-Effort Code Changes
  
  Song Wang, Chetan Bansal, Nachi Nagappan
  
  Information and Software Technology | February 2021, Vol 130
  
  Publication
- Analyzing Web Search Behavior for Software Engineering Tasks
  
  Nikitha Rao, Chetan Bansal, Tom Zimmermann, Ahmed Awadallah, Nachi Nagappan
  
  IEEE BigData | December 2020
  
  PDF
- Product Insights: Analyzing Product Intents in Web Search
  
  Nikitha Rao, Chetan Bansal, Subhabrata (Subho) Mukherjee, Chandra Maddila
  
  CIKM 2020 | October 2020
  
  Publication
- An Empirical Study of Software Exceptions in the Field using Search Logs
  
  Foyzul Hassan, Chetan Bansal, Nachi Nagappan, Tom Zimmermann, Ahmed Awadallah
  
  ESEM 2020 | July 2020
  
  Publication
- Angelic Checking within Static Driver Verifier: Towards high-precision defects without (modeling) cost
  
  Shuvendu Lahiri, Akash Lal, Sridhar Gopinath, Alexander Nutz, Vladimir Levin, Rahul Kumar, Nate Deisinger, Jakob Lichtenberg, Chetan Bansal
  
  FMCAD | July 2020
  
  Best paper award
  
  Publication Video Project Project
- Studying Ransomware Attacks Using Web Search Logs
  
  Chetan Bansal, Pantazis Deligiannis, Chandra Maddila, Nikitha Rao
  
  SIGIR 2020 | July 2020
  
  Publication
- DeCaf: Diagnosing and Triaging Performance Issues in Large-Scale Cloud Services
  
  Chetan Bansal, Sundararajan Renganathan, Ashima Asudani, Olivier Midy, Mathru Janakiraman
  
  ICSE 2020 | May 2020
  
  PDF Project
- Rex: Preventing Bugs and Misconfiguration in Large Services using Correlated Change Analysis
  
  Sonu Mehta, Ranjita Bhagwan, Rahul Kumar, B. Ashok, Chetan Bansal, Chandra Maddila, Christian Bird, Sumit Asthana, Aditya Kumar
  
  Networked System Design and Implementation (NSDI) | February 2020
  
  Publication Project
- Leveraging Change Intents for Characterizing and Identifying Large-Review-Effort Changes
  
  Song Wang, Chetan Bansal, Nachi Nagappan, Adithya Abraham Philip
  
  PROMISE 2019 | September 2019
  
  Publication Project
- WhoDo: Automating Reviewer Suggestions at Scale
  
  Sumit Asthana, Rahul Kumar, Ranjita Bhagwan, Chetan Bansal, Christian Bird, Chandra Maddila, Sonu Mehta, B. Ashok
  
  ESEC/FSE 2019 | August 2019
  
  Publication Project
- Predicting Pull Request Completion Time: A Case Study on Large Scale Cloud Services
  
  Chandra Maddila, Chetan Bansal, Nachi Nagappan
  
  ESEC/FSE 2019 | August 2019
  
  Publication Project
- Building sankie: an AI platform for DevOps
  
  Rahul Kumar, Chetan Bansal, Chandra Maddila, Nitin Sharma, Shawn Martelock, Ravi Bhargava
  
  1st International Workshop on Bots in Software Engineering (BotSE '19) | May 2019
  
  Publication Project
- Hashtag Recommendation for Enterprise Applications
  
  Dhruv Mahajan , Vishwajit Kolathur , Chetan Bansal, Sundararajan Sellamanickam, Johannes Gehrke, Sathiya Keerthi , Suresh Parthasarathy
  
  CIKM | October 2016
  
  Publication
- CloudSDV: Enabling Static Driver Verifier using Microsoft Azure
  
  Rahul Kumar, Thomas Ball, Jakob Lichtenberg, Nate Deisinger, Apoorv Upreti, Chetan Bansal
  
  IFM 2016 Proceedings of the 12th International Conference on Integrated Formal Methods | June 2016
  
  ISBN: 978-3-319-33692-3
  
  Publication Publication
- Cache Timing Attacks Revisited: Efficient and Repeatable Browser History, OS and Network Sniffing
  
  Chetan Bansal, Sören Preibusch, Natasa Milic-Frayling
  
  IFIP International Information Security Conference | May 2015
  
  Publication Publication
- Discovering concrete attacks on website authorization by formal analysis
  
  Chetan Bansal, Karthikeyan Bhargavan, Antoine Delignat-Lavaud, Sergio Maffeis
  
  Journal of Computer Security | July 2014, Vol 22: pp. 601-657
  
  Publication Publication
- Massively Empowered Classroom: Enhancing Technical Education in India
  
  Ed Cutrell, Srinath Bala, Chetan Bansal, Andrew Cross, Naren Datha, Aldo John, Rahul Kumar, Madhusudan Parthasarathy, Siddharth Prakash, Sriram Rajamani, Bill Thies
  
  MSR-TR-2013-127 | December 2013
  
  Publication
- Keys to the Cloud: Formal Analysis and Concrete Attacks on Encrypted Web Storage
  
  Chetan Bansal, Karthikeyan Bhargavan, Antoine Delignat-Lavaud, Sergio Maffeis
  
  2nd Conference on Principles of Security and Trust (POST 2013) | January 2013
  
  Publication
- Discovering Concrete Attacks on Website Authorization by Formal Analysis
  
  Chetan Bansal, Karthikeyan Bhargavan, Sergio Maffeis
  
  25th IEEE Computer Security Foundations Symposium (CSF'12) | June 2012
  
  Publication Publication

- Serving Models, Fast and Slow:Optimizing Heterogeneous LLM Inferencing Workloads at Scale
  
  Kunal Jain, A. Parayil, Ankur Mallick, Rujia Wang, Renee St. Amant, Chetan Bansal, Victor Ruehle, Saravan Rajmohan, Shashwat Jaiswal, Yogesh Simmhan, Anoop Kulkarni, Steve Kofsky
  
  ACM Sigmetrics 2026 | June 2026
  
  Publication Project
- Continuous Benchmark Generation for Evaluating Enterprise-scale LLM Agents
  
  Divyanshu Saxena, Rishikesh Maurya, Xiaoxuan Ou, Gagan Somashekar, Shachee Mishra Gupta, Arun Iyer, Yu Kang, Chetan Bansal, Aditya Akella, Saravan Rajmohan
  
  International Conference on Software Engineering Workshop on Large Language Models for Code | April 2026
  
  DOI Publication Publication
- AutoAdapt: An Automated Domain Adaptation Framework for LLMs
  
  Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan
  
  March 2026
  
  Publication
- Memora: A Harmonic Memory Representation Balancing Abstraction and Specificity
  
  Menglin Xia, Xuchao Zhang, Shantanu Dixit, Paramaguru Harimurugan, Rujia Wang, Victor Ruehle, Robert Sim, Chetan Bansal, Saravan Rajmohan
  
  March 2026
  
  Preprint
- AgentRx: Diagnosing AI Agent Failures from Execution Trajectories
  
  Shraddha Barke, Arnav Goyal, Alind Khare, Avaljot Singh, Suman Nath, Chetan Bansal
  
  February 2026
  
  Preprint
- SUTRADHARA : An Intelligent Orchestrator-Engine Co-design for Tool-based Agentic Inference
  
  Anish Biswas, Kanishk Goel, Jayashree Mohan, Alind Khare, A. Parayil, Ramachandran Ramjee, Chetan Bansal
  
  February 2026
  
  Preprint Project
- Workload Intelligence: Workload-Aware IaaS Abstraction for Cloud Efficiency
  
  Lexiang Huang, A. Parayil, Jue Zhang, Xiaoting Qin, Chetan Bansal, Jovan Stojkovic, Pantea Zardoshti, Pulkit Misra, Eli Cortez, Raphael Ghelman, Íñigo Goiri, Saravan Rajmohan, Jim Kleewein, Rodrigo Fonseca, Timothy Zhu, Ricardo Bianchini
  
  International Conference for High Performance Computing, Networking, Storage, and Analysis (SC) | November 2025
  
  Publication
- ModServe: Modality- and Stage-Aware Resource Disaggregation for Scalable Multimodal Model Serving
  
  Haoran Qiu, Anish Biswas, Zihan Zhao, Jayashree Mohan, Alind Khare, Esha Choukse, Íñigo Goiri, Zeyu Zhang, Haiying Shen, Chetan Bansal, Ramachandran Ramjee, Rodrigo Fonseca
  
  ACM Symposium on Cloud Computing (SoCC) 2025 | November 2025
  
  Preprint Project Project
- Adapting Web Agents with Synthetic Supervision
  
  Zhaoyang Wang, Yiming Liang, Xuchao Zhang, Qianhui Wu, Siwei Han, Anson Bastos, Rujia Wang, Chetan Bansal, Baolin Peng, Jianfeng Gao, Saravan Rajmohan, Huaxiu Yao
  
  November 2025
  
  Publication Project
- Generative Caching for Structurally Similar Prompts and Responses
  
  Sarthak Chakraborty, Suman Nath, Xuchao Zhang, Chetan Bansal, Indranil Gupta
  
  NeurIPS 2025 | November 2025
  
  Preprint
- Attention Enhanced Entity Recommendation for Intelligent Monitoring in Cloud Systems
  
  Fiza Hussain, Anson Bastos, A. Parayil, Ayush Choure, Chetan Bansal, Rujia Wang, Saravan Rajmohan
  
  October 2025
  
  Publication
- REFA: Reference Free Alignment for multi-preference optimization
  
  Taneesh Gupta, Rahul Madhavan, Xuchao Zhang, Chetan Bansal, Saravan Rajmohan
  
  COLM 2025 | July 2025
  
  Publication
- ProtoRAIL: A Risk-cognizant Imitation Agent for Adaptive vCPU Oversubscription In The Cloud
  
  Lu Wang, Mayukh Das, Fangkai Yang, Bo Qiao, Hang Dong, Si Qin, Victor Ruehle, Chetan Bansal, Eli Cortez, Íñigo Goiri, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  MLSys'25 | May 2025
  
  Publication
- AIOpsLab: A Holistic Framework for Evaluating AI Agents for Enabling Autonomous Cloud
  
  Yinfang Chen, Manish Shetty, Gagan Somashekar, Minghua Ma, Yogesh Simmhan, Jonathan Mace, Chetan Bansal, Rujia Wang, Saravan Rajmohan
  
  MLSys '25 | May 2025
  
  Publication
- Towards Cloud Efficiency with Large-scale Workload Characterization
  
  A. Parayil, Jue Zhang, Xiaoting Qin, Íñigo Goiri, Chetan Bansal
  
  ICPE | May 2025
  
  Preprint
- Automated Service Design with Cerulean (Project Showcase)
  
  Vaastav Anand, Alok Kumbhare, Celine Irvene, Chetan Bansal, Gagan Somashekar, Jonathan Mace, Pedro Las-Casas, Ricardo Bianchini, Rodrigo Fonseca
  
  2025 IEEE/ACM International Workshop on Cloud Intelligence & AIOps (AIOps) | May 2025, pp. 1-3
  
  DOI Publication
- Synergistic Weak-Strong Collaboration by Aligning Preferences
  
  Yizhu Jiao, Xuchao Zhang, Zhaoyang Wang, Yubo Ma, Zhun Deng, Rujia Wang, Chetan Bansal, Saravan Rajmohan, Jiawei Han, Huaxiu Yao
  
  ArXiv | April 2025, Vol abs/2504.15188
  
  DOI Publication Publication
- Performance Aware LLM Load Balancer for Mixed Workloads
  
  Kunal Jain, A. Parayil, Ankur Mallick, Esha Choukse, Xiaoting Qin, Jue Zhang, Íñigo Goiri, Rujia Wang, Chetan Bansal, Victor Ruehle, Anoop Kulkarni, Steve Kofsky, Saravan Rajmohan
  
  EuroMLSys 2025 | April 2025
  
  Publication Project
- Anyprefer: An Agentic Framework for Preference Data Synthesis
  
  Yiyang Zhou, Zhaoyang Wang, Tianle Wang, Shangyu Xing, Peng Xia, Bo Li, Kaiyuan Zheng, Zijian Zhang, Zhaorun Chen, Wenhao Zheng, Xuchao Zhang, Chetan Bansal, Weitong Zhang, Ying Wei, Mohit Bansal, Huaxiu Yao
  
  ICLR 2025 | March 2025
  
  Publication PDF
- AMPO: Active Multi-Preference Optimization
  
  Taneesh Gupta, Rahul Madhavan, Xuchao Zhang, Chetan Bansal, Saravan Rajmohan
  
  ICML 2025 | February 2025
  
  DOI Publication Publication
- Intent-based System Design and Operation
  
  Vaastav Anand, Yichen Li, Alok Kumbhare, Celine Irvene, Chetan Bansal, Gagan Somashekar, Jonathan Mace, Pedro Las-Casas, Ricardo Bianchini, Rodrigo Fonseca
  
  Proceedings of the 4th Workshop on Practical Adoption Challenges of ML for Systems | February 2025
  
  DOI Publication Publication
- Verifiable Format Control for Large Language Model Generations
  
  Zhaoyang Wang, Jinqi Jiang, Huichi Zhou, Wenhao Zheng, Xuchao Zhang, Chetan Bansal, Huaxiu Yao
  
  NAACL | February 2025
  
  DOI Publication Publication
- ModServe: Scalable and Resource-Efficient Large Multimodal Model Serving
  
  Haoran Qiu, Anish Biswas, Zihan Zhao, Jayashree Mohan, Alind Khare, Esha Choukse, Íñigo Goiri, Zeyu Zhang, Haiying Shen, Chetan Bansal, Ramachandran Ramjee, Rodrigo Fonseca
  
  February 2025
  
  Publication Project Project
- Ensuring Fair LLM Serving Amid Diverse Applications
  
  Kunal Jain, Ankur Mallick, A. Parayil, Renee St. Amant, Rujia Wang, Victor Ruehle, Chetan Bansal, Saravan Rajmohan, Redwan Ibne Seraj Khan, Haiying Shen, Anoop Kulkarni, Steve Kofsky, Pankhuri Choudhary, Yue Cheng
  
  ArXiv | November 2024
  
  Publication Project
- Building AI Agents for Autonomous Clouds: Challenges and Design Principles
  
  Manisha M Shetty, Yinfang Chen, Gagan Somashekar, Minghua Ma, Yogesh L. Simmhan, Xuchao Zhang, Jonathan Mace, Pedro Las-Casas, Shachee Mishra Gupta, Suman Nath, Chetan Bansal, Saravan Rajmohan
  
  2024 Symposium on Cloud Computing | November 2024
  
  Publication
- CARMO: Dynamic Criteria Generation for Context-Aware Reward Modelling
  
  Taneesh Gupta, Shivam Shandilya, Xuchao Zhang, Supriyo Ghosh, Chetan Bansal, Huaxiu Yao, Saravan Rajmohan
  
  2024 Meeting of the Association for Computational Linguistics | October 2024
  
  Publication
- CREAM: Consistency Regularized Self-Rewarding Language Models
  
  Zhaoyang Wang, Weilei He, Zhiyuan Liang, Xuchao Zhang, Chetan Bansal, Ying Wei, Weitong Zhang, Huaxiu Yao
  
  ICLR 2025 | October 2024
  
  DOI Publication Publication
- FLASH: A Workflow Automation Agent for Diagnosing Recurring Incidents
  
  Xuchao Zhang, Tanish Mittal, Chetan Bansal, Rujia Wang, Minghua Ma, Zhixin Ren, Hao Huang, Saravan Rajmohan
  
  October 2024
  
  Publication Project
- COIN: Chance-Constrained Imitation Learning for Safe and Adaptive Resource Oversubscription under Uncertainty
  
  Lu Wang, Mayukh Das, Fangkai Yang, Chao Du, Bo Qiao, Hang Dong, Chetan Bansal, Si Qin, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang, Qi Zhang
  
  CIKM'24 | October 2024
  
  PDF
- Intelligent Router for LLM Workloads: Improving Performance Through Workload-Aware Scheduling
  
  A. Parayil, Ankur Mallick, Esha Choukse, Xiaoting Qin, Jue Zhang, Íñigo Goiri, Rujia Wang, Chetan Bansal, Victor Ruehle, Saravan Rajmohan, Kunal Jain, Anoop Kulkarni, Steve Kofsky
  
  ArXiv | August 2024, Vol abs/2408.13510
  
  Preprint
- Automated Root Causing of Cloud Incidents using In-Context Learning with GPT-4
  
  Xuchao Zhang, Supriyo GHOSH, Chetan Bansal, Rujia Wang, Minghua Ma, Yu Kang, Saravan Rajmohan
  
  Foundations of Software Engineering (FSE) | July 2024
  
  Publication
- X-lifecycle Learning for Cloud Incident Management using LLMs
  
  Drishti Goel, Fiza Husain, Aditya Singh, Supriyo GHOSH, A. Parayil, Chetan Bansal, Xuchao Zhang, Saravan Rajmohan
  
  Foundations of Software Engineering (FSE) | July 2024
  
  Publication
- MonitorAssistant: Simplifying Cloud Service Monitoring via Large Language Models
  
  Zhaoyang Yu, Minghua Ma, Chaoyun Zhang, Si Qin, Yu Kang, Chetan Bansal, Saravan Rajmohan, Yingnong Dang, Changhua Pei, Dan Pei, Qingwei Lin 林庆维, Dongmei Zhang
  
  Foundations of Software Engineering (FSE) | July 2024
  
  DOI Publication
- MonitorAssistant: Simplifying Cloud Service Monitoring via Large Language Models
  
  Zhaoyang Yu, Minghua Ma, Chaoyun Zhang, Si Qin, Yu Kang, Chetan Bansal, Saravan Rajmohan, Yingnong Dang, Changhua Pei, Dan Pei, Qingwei Lin 林庆维, Dongmei Zhang
  
  ESEC/FSE'24 Industry Track | July 2024
  
  Publication Publication
- Exploring LLM-based Agents for Root Cause Analysis
  
  Devjeet Roy, Xuchao Zhang, Rashi Bhave, Chetan Bansal, Pedro Las-Casas, Rodrigo Fonseca, Saravan Rajmohan
  
  FSE '24: 32nd ACM International Conference on the Foundations of Software Engineering | July 2024
  
  Publication Project
- CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models
  
  Peng Xia, Ze Chen, Juanxi Tian, Yangrui Gong, Ruibo Hou, Yue Xu, Zhenbang Wu, Zhiyuan Fan, Yiyang Zhou, Kangyu Zhu, Wenhao Zheng, Zhaoyang Wang, Xiao Wang, Xuchao Zhang, Chetan Bansal, Marc Niethammer, Junzhou Huang, Hongtu Zhu, Yun Li, Jimeng Sun, Zongyuan Ge, Gang Li, James Zou, Huaxiu Yao
  
  NeurIPS 2024 | June 2024
  
  DOI Publication Publication
- Dependency Aware Incident Linking in Large Cloud Systems
  
  Supriyo GHOSH, Karish Grover, Jimmy Wong, Chetan Bansal, Rakesh Namineni, Mohit Verma, Saravan Rajmohan
  
  The Web Conference (WWW) | May 2024
  
  Publication
- Intelligent Overclocking for Improved Cloud Efficiency
  
  Aditya Soni, Mayukh Das, Pulkit Misra, Chetan Bansal
  
  AIOps '24 workshop @ ASPLOS [5th International Workshop on Cloud Intelligence / AIOps] | April 2024
  
  Preprint
- Intelligent Monitoring Framework for Cloud Services: A Data-Driven Approach
  
  Pooja Srinivas, Fiza Husain, A. Parayil, Ayush Choure, Chetan Bansal, Saravan Rajmohan
  
  46th International Conference on Software Engineering: Software Engineering in Practice (ICSE-SEIP’24) | April 2024
  
  Preprint
- Workload Intelligence: Punching Holes Through the Cloud Abstraction
  
  Lexiang Huang, A. Parayil, Jue Zhang, Xiaoting Qin, Chetan Bansal, Jovan Stojkovic, Pantea Zardoshti, Pulkit Misra, Eli Cortez, Raphael Ghelman, Íñigo Goiri, Saravan Rajmohan, Jim Kleewein, Rodrigo Fonseca, Timothy Zhu, Ricardo Bianchini
  
  April 2024
  
  Preprint
- PACE-LM: Prompting and Augmentation for Calibrated Confidence Estimation with GPT-4 in Cloud Incident Root Cause Analysis
  
  Dylan Zhang, Xuchao Zhang, Chetan Bansal, Pedro Las-Casas, Rodrigo Fonseca, Saravan Rajmohan
  
  September 2023
  
  Publication
- Recommending Root-Cause and Mitigation Steps for Cloud Incidents using Large Language Models
  
  Toufique Ahmed, Supriyo GHOSH, Chetan Bansal, Tom Zimmermann, Xuchao Zhang, Saravan Rajmohan
  
  ICSE 2023 | May 2023
  
  Publication
- AutoTSG: Learning and Synthesis for Incident Troubleshooting
  
  Manish Shetty, Chetan Bansal, Sai Pramod Upadhyayula, Arjun Radhakrishna, Anurag Gupta
  
  ESEC/FSE 2022 | November 2022
  
  Publication Publication Publication
- DeepAnalyze: Learning to Localize Crashes at Scale
  
  Manish Shetty, Chetan Bansal, Suman Nath, Sean Bowles, Henry Wang, Ozgur Arman, Siamak Ahari
  
  ICSE 2022 | May 2022
  
  Publication Project
- Spot Virtual Machine Eviction Prediction in Microsoft Cloud
  
  Fangkai Yang, Bowen Pang, Jue Zhang, Bo Qiao, Lu Wang, Camille Couturier, Chetan Bansal, Soumya Ram, Si Qin, Zhen Ma, Íñigo Goiri, Eli Cortez, Senthil Baladhandayutham, Victor Rühle, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  WWW'22 Companion | April 2022
  
  Publication
- SoftNER: Mining knowledge graphs from Cloud Incidents
  
  Manish Shetty, Chetan Bansal, Sumit Kumar, Nikitha Rao, Nachiappan Nagappan
  
  Empirical Software Engineering | April 2022, Vol 27(4)
  
  Publication
- Micro-climate Prediction – Multi Scale Encoder-decoder based Deep Learning Framework
  
  Peeyush Kumar, Ranveer Chandra, Chetan Bansal, Shivkumar Kalyanaraman, Tanuja Ganu, Michael Grant
  
  2021 Knowledge Discovery and Data Mining | August 2021
  
  Publication Publication Project Project
- Neural Knowledge Extraction From Cloud Service Incidents
  
  Manish Shetty, Chetan Bansal, Sumit Kumar, Nikitha Rao, Nachiappan Nagappan, Tom Zimmermann
  
  43rd International Conference on Software Engineering (ICSE '21) - SEIP Track | May 2021
- Predicting Pull Request Completion Time: A Case Study on Large Scale Cloud Services
  
  Chandra Maddila, Chetan Bansal, Nachi Nagappan
  
  ESEC/FSE 2019 | August 2019
  
  Publication Project
- AgentRx: Diagnosing AI Agent Failures from Execution Trajectories
  
  Shraddha Barke, Arnav Goyal, Alind Khare, Avaljot Singh, Suman Nath, Chetan Bansal
  
  February 2026
  
  Preprint
- Automated Service Design with Cerulean (Project Showcase)
  
  Vaastav Anand, Alok Kumbhare, Celine Irvene, Chetan Bansal, Gagan Somashekar, Jonathan Mace, Pedro Las-Casas, Ricardo Bianchini, Rodrigo Fonseca
  
  2025 IEEE/ACM International Workshop on Cloud Intelligence & AIOps (AIOps) | May 2025, pp. 1-3
  
  DOI Publication
- Time Warp: The Gap Between Developers’ Ideal vs Actual Workweeks in an AI-Driven Era
  
  Sukrit Kumar, Drishti Goel, Tom Zimmermann, Brian Houck, B. Ashok, Chetan Bansal
  
  ICSE SEIP '25 | April 2025
  
  Distinguished Paper Award
  
  Preprint
- Intent-based System Design and Operation
  
  Vaastav Anand, Yichen Li, Alok Kumbhare, Celine Irvene, Chetan Bansal, Gagan Somashekar, Jonathan Mace, Pedro Las-Casas, Ricardo Bianchini, Rodrigo Fonseca
  
  Proceedings of the 4th Workshop on Practical Adoption Challenges of ML for Systems | February 2025
  
  DOI Publication Publication
- Building AI Agents for Autonomous Clouds: Challenges and Design Principles
  
  Manisha M Shetty, Yinfang Chen, Gagan Somashekar, Minghua Ma, Yogesh L. Simmhan, Xuchao Zhang, Jonathan Mace, Pedro Las-Casas, Shachee Mishra Gupta, Suman Nath, Chetan Bansal, Saravan Rajmohan
  
  2024 Symposium on Cloud Computing | November 2024
  
  Publication
- FLASH: A Workflow Automation Agent for Diagnosing Recurring Incidents
  
  Xuchao Zhang, Tanish Mittal, Chetan Bansal, Rujia Wang, Minghua Ma, Zhixin Ren, Hao Huang, Saravan Rajmohan
  
  October 2024
  
  Publication Project
- Intelligent Monitoring Framework for Cloud Services: A Data-Driven Approach
  
  Pooja Srinivas, Fiza Husain, A. Parayil, Ayush Choure, Chetan Bansal, Saravan Rajmohan
  
  46th International Conference on Software Engineering: Software Engineering in Practice (ICSE-SEIP’24) | April 2024
  
  Preprint
- Recommending Root-Cause and Mitigation Steps for Cloud Incidents using Large Language Models
  
  Toufique Ahmed, Supriyo GHOSH, Chetan Bansal, Tom Zimmermann, Xuchao Zhang, Saravan Rajmohan
  
  ICSE 2023 | May 2023
  
  Publication
- AutoTSG: Learning and Synthesis for Incident Troubleshooting
  
  Manish Shetty, Chetan Bansal, Sai Pramod Upadhyayula, Arjun Radhakrishna, Anurag Gupta
  
  ESEC/FSE 2022 | November 2022
  
  Publication Publication Publication
- How to Fight Production Incidents? An Empirical Study on a Large-scale Cloud Service
  
  Supriyo GHOSH, Manish Shetty, Chetan Bansal, Suman Nath
  
  SoCC 2022 | November 2022
  
  Best Paper Award
  
  Publication PDF Project
- Characterizing the Usage of CI Tools in ML Projects
  
  Dhia Elhaq Rzig, Foyzul Hassan, Chetan Bansal, Nachiappan Nagappan
  
  ESEM 2022 | September 2022
  
  Publication
- DeepAnalyze: Learning to Localize Crashes at Scale
  
  Manish Shetty, Chetan Bansal, Suman Nath, Sean Bowles, Henry Wang, Ozgur Arman, Siamak Ahari
  
  ICSE 2022 | May 2022
  
  Publication Project
- Spot Virtual Machine Eviction Prediction in Microsoft Cloud
  
  Fangkai Yang, Bowen Pang, Jue Zhang, Bo Qiao, Lu Wang, Camille Couturier, Chetan Bansal, Soumya Ram, Si Qin, Zhen Ma, Íñigo Goiri, Eli Cortez, Senthil Baladhandayutham, Victor Rühle, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  WWW'22 Companion | April 2022
  
  Publication
- SoftNER: Mining knowledge graphs from Cloud Incidents
  
  Manish Shetty, Chetan Bansal, Sumit Kumar, Nikitha Rao, Nachiappan Nagappan
  
  Empirical Software Engineering | April 2022, Vol 27(4)
  
  Publication
- Search4Code: Code Search Intent Classification Using Weak Supervision
  
  Nikitha Rao, Chetan Bansal, Joe Guan
  
  Mining Software Repositories (MSR '21) | May 2021
  
  PDF
- Neural Knowledge Extraction From Cloud Service Incidents
  
  Manish Shetty, Chetan Bansal, Sumit Kumar, Nikitha Rao, Nachiappan Nagappan, Tom Zimmermann
  
  43rd International Conference on Software Engineering (ICSE '21) - SEIP Track | May 2021
- Large-Scale Intent Analysis for Identifying Large-Review-Effort Code Changes
  
  Song Wang, Chetan Bansal, Nachi Nagappan
  
  Information and Software Technology | February 2021, Vol 130
  
  Publication
- Analyzing Web Search Behavior for Software Engineering Tasks
  
  Nikitha Rao, Chetan Bansal, Tom Zimmermann, Ahmed Awadallah, Nachi Nagappan
  
  IEEE BigData | December 2020
  
  PDF
- An Empirical Study of Software Exceptions in the Field using Search Logs
  
  Foyzul Hassan, Chetan Bansal, Nachi Nagappan, Tom Zimmermann, Ahmed Awadallah
  
  ESEM 2020 | July 2020
  
  Publication
- Angelic Checking within Static Driver Verifier: Towards high-precision defects without (modeling) cost
  
  Shuvendu Lahiri, Akash Lal, Sridhar Gopinath, Alexander Nutz, Vladimir Levin, Rahul Kumar, Nate Deisinger, Jakob Lichtenberg, Chetan Bansal
  
  FMCAD | July 2020
  
  Best paper award
  
  Publication Video Project Project
- DeCaf: Diagnosing and Triaging Performance Issues in Large-Scale Cloud Services
  
  Chetan Bansal, Sundararajan Renganathan, Ashima Asudani, Olivier Midy, Mathru Janakiraman
  
  ICSE 2020 | May 2020
  
  PDF Project
- Rex: Preventing Bugs and Misconfiguration in Large Services using Correlated Change Analysis
  
  Sonu Mehta, Ranjita Bhagwan, Rahul Kumar, B. Ashok, Chetan Bansal, Chandra Maddila, Christian Bird, Sumit Asthana, Aditya Kumar
  
  Networked System Design and Implementation (NSDI) | February 2020
  
  Publication Project
- Leveraging Change Intents for Characterizing and Identifying Large-Review-Effort Changes
  
  Song Wang, Chetan Bansal, Nachi Nagappan, Adithya Abraham Philip
  
  PROMISE 2019 | September 2019
  
  Publication Project
- WhoDo: Automating Reviewer Suggestions at Scale
  
  Sumit Asthana, Rahul Kumar, Ranjita Bhagwan, Chetan Bansal, Christian Bird, Chandra Maddila, Sonu Mehta, B. Ashok
  
  ESEC/FSE 2019 | August 2019
  
  Publication Project
- Predicting Pull Request Completion Time: A Case Study on Large Scale Cloud Services
  
  Chandra Maddila, Chetan Bansal, Nachi Nagappan
  
  ESEC/FSE 2019 | August 2019
  
  Publication Project
- Building sankie: an AI platform for DevOps
  
  Rahul Kumar, Chetan Bansal, Chandra Maddila, Nitin Sharma, Shawn Martelock, Ravi Bhargava
  
  1st International Workshop on Bots in Software Engineering (BotSE '19) | May 2019
  
  Publication Project
- Serving Models, Fast and Slow:Optimizing Heterogeneous LLM Inferencing Workloads at Scale
  
  Kunal Jain, A. Parayil, Ankur Mallick, Rujia Wang, Renee St. Amant, Chetan Bansal, Victor Ruehle, Saravan Rajmohan, Shashwat Jaiswal, Yogesh Simmhan, Anoop Kulkarni, Steve Kofsky
  
  ACM Sigmetrics 2026 | June 2026
  
  Publication Project
- SUTRADHARA : An Intelligent Orchestrator-Engine Co-design for Tool-based Agentic Inference
  
  Anish Biswas, Kanishk Goel, Jayashree Mohan, Alind Khare, A. Parayil, Ramachandran Ramjee, Chetan Bansal
  
  February 2026
  
  Preprint Project
- ModServe: Modality- and Stage-Aware Resource Disaggregation for Scalable Multimodal Model Serving
  
  Haoran Qiu, Anish Biswas, Zihan Zhao, Jayashree Mohan, Alind Khare, Esha Choukse, Íñigo Goiri, Zeyu Zhang, Haiying Shen, Chetan Bansal, Ramachandran Ramjee, Rodrigo Fonseca
  
  ACM Symposium on Cloud Computing (SoCC) 2025 | November 2025
  
  Preprint Project Project
- Generative Caching for Structurally Similar Prompts and Responses
  
  Sarthak Chakraborty, Suman Nath, Xuchao Zhang, Chetan Bansal, Indranil Gupta
  
  NeurIPS 2025 | November 2025
  
  Preprint
- Triangle: Empowering Incident Triage with Multi-Agent
  
  Zhaoyang Yu, Aoyang Fang, Minghua Ma, Chaoyun Zhang, Ze Li, Murali Chintalapati, Xuchao Zhang, Rujia Wang, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, et.al
  
  ASE'25 | November 2025
  
  Publication Project
- ProtoRAIL: A Risk-cognizant Imitation Agent for Adaptive vCPU Oversubscription In The Cloud
  
  Lu Wang, Mayukh Das, Fangkai Yang, Bo Qiao, Hang Dong, Si Qin, Victor Ruehle, Chetan Bansal, Eli Cortez, Íñigo Goiri, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  MLSys'25 | May 2025
  
  Publication
- AIOpsLab: A Holistic Framework for Evaluating AI Agents for Enabling Autonomous Cloud
  
  Yinfang Chen, Manish Shetty, Gagan Somashekar, Minghua Ma, Yogesh Simmhan, Jonathan Mace, Chetan Bansal, Rujia Wang, Saravan Rajmohan
  
  MLSys '25 | May 2025
  
  Publication
- Towards Cloud Efficiency with Large-scale Workload Characterization
  
  A. Parayil, Jue Zhang, Xiaoting Qin, Íñigo Goiri, Chetan Bansal
  
  ICPE | May 2025
  
  Preprint
- Automated Service Design with Cerulean (Project Showcase)
  
  Vaastav Anand, Alok Kumbhare, Celine Irvene, Chetan Bansal, Gagan Somashekar, Jonathan Mace, Pedro Las-Casas, Ricardo Bianchini, Rodrigo Fonseca
  
  2025 IEEE/ACM International Workshop on Cloud Intelligence & AIOps (AIOps) | May 2025, pp. 1-3
  
  DOI Publication
- Coach: Exploiting Temporal Patterns for All-Resource Oversubscription in Cloud Platforms
  
  Benjamin Reidys, Pantea Zardoshti, Íñigo Goiri, Celine Irvene, Daniel S. Berger, Haoran Ma, Kapil Arya, Taylor Stark, Eugene Bak, Mehmet Iyigun, Stanko Novakovic, Lisa Hsu, Karel Trueba, Abhisek Pan, Chetan Bansal, Saravan Rajmohan, Jian Huang, Ricardo Bianchini
  
  ASPLOS | March 2025
  
  Publication Project
- Intent-based System Design and Operation
  
  Vaastav Anand, Yichen Li, Alok Kumbhare, Celine Irvene, Chetan Bansal, Gagan Somashekar, Jonathan Mace, Pedro Las-Casas, Ricardo Bianchini, Rodrigo Fonseca
  
  Proceedings of the 4th Workshop on Practical Adoption Challenges of ML for Systems | February 2025
  
  DOI Publication Publication
- Ensuring Fair LLM Serving Amid Diverse Applications
  
  Kunal Jain, Ankur Mallick, A. Parayil, Renee St. Amant, Rujia Wang, Victor Ruehle, Chetan Bansal, Saravan Rajmohan, Redwan Ibne Seraj Khan, Haiying Shen, Anoop Kulkarni, Steve Kofsky, Pankhuri Choudhary, Yue Cheng
  
  ArXiv | November 2024
  
  Publication Project
- Building AI Agents for Autonomous Clouds: Challenges and Design Principles
  
  Manisha M Shetty, Yinfang Chen, Gagan Somashekar, Minghua Ma, Yogesh L. Simmhan, Xuchao Zhang, Jonathan Mace, Pedro Las-Casas, Shachee Mishra Gupta, Suman Nath, Chetan Bansal, Saravan Rajmohan
  
  2024 Symposium on Cloud Computing | November 2024
  
  Publication
- COIN: Chance-Constrained Imitation Learning for Safe and Adaptive Resource Oversubscription under Uncertainty
  
  Lu Wang, Mayukh Das, Fangkai Yang, Chao Du, Bo Qiao, Hang Dong, Chetan Bansal, Si Qin, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang, Qi Zhang
  
  CIKM'24 | October 2024
  
  PDF
- Intelligent Router for LLM Workloads: Improving Performance Through Workload-Aware Scheduling
  
  A. Parayil, Ankur Mallick, Esha Choukse, Xiaoting Qin, Jue Zhang, Íñigo Goiri, Rujia Wang, Chetan Bansal, Victor Ruehle, Saravan Rajmohan, Kunal Jain, Anoop Kulkarni, Steve Kofsky
  
  ArXiv | August 2024, Vol abs/2408.13510
  
  Preprint
- Large Language Models Can Provide Accurate and Interpretable Incident Triage
  
  Zexin Wang, Minghua Ma, Ze Li, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  2024 International Symposium on Software Reliability Engineering | August 2024
  
  Publication
- Designing Cloud Servers for Lower Carbon
  
  Jaylen Wang, Daniel S. Berger, Fiodar Kazhamiaka, Celine Irvene, Chaojie Zhang, Esha Choukse, Kali Frost, Rodrigo Fonseca, Brijesh Warrier, Chetan Bansal, Jonathan Stern, Ricardo Bianchini, Akshitha Sriraman
  
  ISCA | June 2024
  
  Publication
- SmartOClock: Workload- and Risk-Aware Overclocking in the Cloud
  
  Jovan Stojkovic, Pulkit Misra, Íñigo Goiri, Sam Whitlock, Esha Choukse, Mayukh Das, Chetan Bansal, Jason Lee, Zoey Sun, Haoran Qiu, Reed Zimmermann, Savyasachi Samal, Brijesh Warrier, Ashish Raniwala, Ricardo Bianchini
  
  ISCA | June 2024
  
  Publication
- Intelligent Overclocking for Improved Cloud Efficiency
  
  Aditya Soni, Mayukh Das, Pulkit Misra, Chetan Bansal
  
  AIOps '24 workshop @ ASPLOS [5th International Workshop on Cloud Intelligence / AIOps] | April 2024
  
  Preprint
- Intelligent Monitoring Framework for Cloud Services: A Data-Driven Approach
  
  Pooja Srinivas, Fiza Husain, A. Parayil, Ayush Choure, Chetan Bansal, Saravan Rajmohan
  
  46th International Conference on Software Engineering: Software Engineering in Practice (ICSE-SEIP’24) | April 2024
  
  Preprint
- Workload Intelligence: Punching Holes Through the Cloud Abstraction
  
  Lexiang Huang, A. Parayil, Jue Zhang, Xiaoting Qin, Chetan Bansal, Jovan Stojkovic, Pantea Zardoshti, Pulkit Misra, Eli Cortez, Raphael Ghelman, Íñigo Goiri, Saravan Rajmohan, Jim Kleewein, Rodrigo Fonseca, Timothy Zhu, Ricardo Bianchini
  
  ArXiv | April 2024, Vol abs/2404.19143
  
  Preprint
- PACE-LM: Prompting and Augmentation for Calibrated Confidence Estimation with GPT-4 in Cloud Incident Root Cause Analysis
  
  Dylan Zhang, Xuchao Zhang, Chetan Bansal, Pedro Las-Casas, Rodrigo Fonseca, Saravan Rajmohan
  
  September 2023
  
  Publication
- AutoARTS: Taxonomy, Insights and Tools for Root Cause Labelling of Incidents in Microsoft Azure
  
  Pradeep Dogga, Chetan Bansal, Richard Costleigh, Gopinath Jayagopal, Suman Nath, Xuchao Zhang
  
  2023 USENIX Annual Technical Conference | July 2023
  
  Publication Project
- How Different are the Cloud Workloads? Characterizing Large-Scale Private and Public Cloud Workloads
  
  Xiaoting Qin, Minghua Ma, Yueng Zhao, Jue Zhang, Chao Du, Yudong Liu, A. Parayil, Chetan Bansal, Saravan Rajmohan, Íñigo Goiri, Eli Cortez, Si Qin, Qingwei Lin 林庆维, Dongmei Zhang
  
  DSN'23 | June 2023
  
  Publication
- Snape: Reliable and Low-Cost Computing with Mixture of Spot and On-Demand VMs
  
  Fangkai Yang, Lu Wang, Zhenyu Xu, Jue Zhang, Liqun Li, Bo Qiao, Camille Couturier, Chetan Bansal, Soumya Ram, Si Qin, Zhen Ma, Íñigo Goiri, Eli Cortez, Terry Yang, Victor Ruehle, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  ASPLOS'23 | March 2023
  
  Publication
- AutoTSG: Learning and Synthesis for Incident Troubleshooting
  
  Manish Shetty, Chetan Bansal, Sai Pramod Upadhyayula, Arjun Radhakrishna, Anurag Gupta
  
  ESEC/FSE 2022 | November 2022
  
  Publication Publication Publication
- How to Fight Production Incidents? An Empirical Study on a Large-scale Cloud Service
  
  Supriyo GHOSH, Manish Shetty, Chetan Bansal, Suman Nath
  
  SoCC 2022 | November 2022
  
  Best Paper Award
  
  Publication PDF Project
- DeepAnalyze: Learning to Localize Crashes at Scale
  
  Manish Shetty, Chetan Bansal, Suman Nath, Sean Bowles, Henry Wang, Ozgur Arman, Siamak Ahari
  
  ICSE 2022 | May 2022
  
  Publication Project
- Spot Virtual Machine Eviction Prediction in Microsoft Cloud
  
  Fangkai Yang, Bowen Pang, Jue Zhang, Bo Qiao, Lu Wang, Camille Couturier, Chetan Bansal, Soumya Ram, Si Qin, Zhen Ma, Íñigo Goiri, Eli Cortez, Senthil Baladhandayutham, Victor Rühle, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  WWW'22 Companion | April 2022
  
  Publication
- DeCaf: Diagnosing and Triaging Performance Issues in Large-Scale Cloud Services
  
  Chetan Bansal, Sundararajan Renganathan, Ashima Asudani, Olivier Midy, Mathru Janakiraman
  
  ICSE 2020 | May 2020
  
  PDF Project
- Rex: Preventing Bugs and Misconfiguration in Large Services using Correlated Change Analysis
  
  Sonu Mehta, Ranjita Bhagwan, Rahul Kumar, B. Ashok, Chetan Bansal, Chandra Maddila, Christian Bird, Sumit Asthana, Aditya Kumar
  
  Networked System Design and Implementation (NSDI) | February 2020
  
  Publication Project
- Building sankie: an AI platform for DevOps
  
  Rahul Kumar, Chetan Bansal, Chandra Maddila, Nitin Sharma, Shawn Martelock, Ravi Bhargava
  
  1st International Workshop on Bots in Software Engineering (BotSE '19) | May 2019
  
  Publication Project
- Attention Enhanced Entity Recommendation for Intelligent Monitoring in Cloud Systems
  
  Fiza Hussain, Anson Bastos, A. Parayil, Ayush Choure, Chetan Bansal, Rujia Wang, Saravan Rajmohan
  
  October 2025
  
  Publication
- Can We Trust Auto-Mitigation? Improving Cloud Failure Prediction with Uncertain Positive Learning
  
  Haozhe Li, Minghua Ma, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  2024 International Symposium on Software Reliability Engineering | October 2024
  
  Publication
- Early Bird: Ensuring Reliability of Cloud Systems Through Early Failure Prediction
  
  Yudong Liu, Minghua Ma, Pu Zhao, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  2024 International Symposium on Software Reliability Engineering | October 2024
  
  Publication
- Exploring LLM-based Agents for Root Cause Analysis
  
  Devjeet Roy, Xuchao Zhang, Rashi Bhave, Chetan Bansal, Pedro Las-Casas, Rodrigo Fonseca, Saravan Rajmohan
  
  FSE '24: 32nd ACM International Conference on the Foundations of Software Engineering | July 2024
  
  Publication Project
- Spot Virtual Machine Eviction Prediction in Microsoft Cloud
  
  Fangkai Yang, Bowen Pang, Jue Zhang, Bo Qiao, Lu Wang, Camille Couturier, Chetan Bansal, Soumya Ram, Si Qin, Zhen Ma, Íñigo Goiri, Eli Cortez, Senthil Baladhandayutham, Victor Rühle, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  WWW'22 Companion | April 2022
  
  Publication
- Triangle: Empowering Incident Triage with Multi-Agent
  
  Zhaoyang Yu, Aoyang Fang, Minghua Ma, Chaoyun Zhang, Ze Li, Murali Chintalapati, Xuchao Zhang, Rujia Wang, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, et.al
  
  ASE'25 | November 2025
  
  Publication Project
- AIOpsLab: A Holistic Framework for Evaluating AI Agents for Enabling Autonomous Cloud
  
  Yinfang Chen, Manish Shetty, Gagan Somashekar, Minghua Ma, Yogesh Simmhan, Jonathan Mace, Chetan Bansal, Rujia Wang, Saravan Rajmohan
  
  MLSys '25 | May 2025
  
  Publication
- Spot Virtual Machine Eviction Prediction in Microsoft Cloud
  
  Fangkai Yang, Bowen Pang, Jue Zhang, Bo Qiao, Lu Wang, Camille Couturier, Chetan Bansal, Soumya Ram, Si Qin, Zhen Ma, Íñigo Goiri, Eli Cortez, Senthil Baladhandayutham, Victor Rühle, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  WWW'22 Companion | April 2022
  
  Publication
- CloudSDV: Enabling Static Driver Verifier using Microsoft Azure
  
  Rahul Kumar, Thomas Ball, Jakob Lichtenberg, Nate Deisinger, Apoorv Upreti, Chetan Bansal
  
  IFM 2016 Proceedings of the 12th International Conference on Integrated Formal Methods | June 2016
  
  ISBN: 978-3-319-33692-3
  
  Publication Publication
- CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models
  
  Peng Xia, Ze Chen, Juanxi Tian, Yangrui Gong, Ruibo Hou, Yue Xu, Zhenbang Wu, Zhiyuan Fan, Yiyang Zhou, Kangyu Zhu, Wenhao Zheng, Zhaoyang Wang, Xiao Wang, Xuchao Zhang, Chetan Bansal, Marc Niethammer, Junzhou Huang, Hongtu Zhu, Yun Li, Jimeng Sun, Zongyuan Ge, Gang Li, James Zou, Huaxiu Yao
  
  NeurIPS 2024 | June 2024
  
  DOI Publication Publication
- Recommending Root-Cause and Mitigation Steps for Cloud Incidents using Large Language Models
  
  Toufique Ahmed, Supriyo GHOSH, Chetan Bansal, Tom Zimmermann, Xuchao Zhang, Saravan Rajmohan
  
  ICSE 2023 | May 2023
  
  Publication
- Micro-climate Prediction – Multi Scale Encoder-decoder based Deep Learning Framework
  
  Peeyush Kumar, Ranveer Chandra, Chetan Bansal, Shivkumar Kalyanaraman, Tanuja Ganu, Michael Grant
  
  2021 Knowledge Discovery and Data Mining | August 2021
  
  Publication Publication Project Project
- Micro-climate Prediction – Multi Scale Encoder-decoder based Deep Learning Framework
  
  Peeyush Kumar, Ranveer Chandra, Chetan Bansal, Shivkumar Kalyanaraman, Tanuja Ganu, Michael Grant
  
  2021 Knowledge Discovery and Data Mining | August 2021
  
  Publication Publication Project Project
- Massively Empowered Classroom: Enhancing Technical Education in India
  
  Ed Cutrell, Srinath Bala, Chetan Bansal, Andrew Cross, Naren Datha, Aldo John, Rahul Kumar, Madhusudan Parthasarathy, Siddharth Prakash, Sriram Rajamani, Bill Thies
  
  MSR-TR-2013-127 | December 2013
  
  Publication
- Analyzing Web Search Behavior for Software Engineering Tasks
  
  Nikitha Rao, Chetan Bansal, Tom Zimmermann, Ahmed Awadallah, Nachi Nagappan
  
  IEEE BigData | December 2020
  
  PDF
- Product Insights: Analyzing Product Intents in Web Search
  
  Nikitha Rao, Chetan Bansal, Subhabrata (Subho) Mukherjee, Chandra Maddila
  
  CIKM 2020 | October 2020
  
  Publication
- Studying Ransomware Attacks Using Web Search Logs
  
  Chetan Bansal, Pantazis Deligiannis, Chandra Maddila, Nikitha Rao
  
  SIGIR 2020 | July 2020
  
  Publication
- An Empirical Study of Software Exceptions in the Field using Search Logs
  
  Foyzul Hassan, Chetan Bansal, Nachi Nagappan, Tom Zimmermann, Ahmed Awadallah
  
  ESEM 2020 | July 2020
  
  Publication
- Hashtag Recommendation for Enterprise Applications
  
  Dhruv Mahajan , Vishwajit Kolathur , Chetan Bansal, Sundararajan Sellamanickam, Johannes Gehrke, Sathiya Keerthi , Suresh Parthasarathy
  
  CIKM | October 2016
  
  Publication
- Cache Timing Attacks Revisited: Efficient and Repeatable Browser History, OS and Network Sniffing
  
  Chetan Bansal, Sören Preibusch, Natasa Milic-Frayling
  
  IFIP International Information Security Conference | May 2015
  
  Publication Publication
- Discovering concrete attacks on website authorization by formal analysis
  
  Chetan Bansal, Karthikeyan Bhargavan, Antoine Delignat-Lavaud, Sergio Maffeis
  
  Journal of Computer Security | July 2014, Vol 22: pp. 601-657
  
  Publication Publication
- Keys to the Cloud: Formal Analysis and Concrete Attacks on Encrypted Web Storage
  
  Chetan Bansal, Karthikeyan Bhargavan, Antoine Delignat-Lavaud, Sergio Maffeis
  
  2nd Conference on Principles of Security and Trust (POST 2013) | January 2013
  
  Publication
- Discovering Concrete Attacks on Website Authorization by Formal Analysis
  
  Chetan Bansal, Karthikeyan Bhargavan, Sergio Maffeis
  
  25th IEEE Computer Security Foundations Symposium (CSF'12) | June 2012
  
  Publication Publication
- Massively Empowered Classroom: Enhancing Technical Education in India
  
  Ed Cutrell, Srinath Bala, Chetan Bansal, Andrew Cross, Naren Datha, Aldo John, Rahul Kumar, Madhusudan Parthasarathy, Siddharth Prakash, Sriram Rajamani, Bill Thies
  
  MSR-TR-2013-127 | December 2013
  
  Publication
- Massively Empowered Classroom: Enhancing Technical Education in India
  
  Ed Cutrell, Srinath Bala, Chetan Bansal, Andrew Cross, Naren Datha, Aldo John, Rahul Kumar, Madhusudan Parthasarathy, Siddharth Prakash, Sriram Rajamani, Bill Thies
  
  MSR-TR-2013-127 | December 2013
  
  Publication

- Serving Models, Fast and Slow:Optimizing Heterogeneous LLM Inferencing Workloads at Scale
  
  Kunal Jain, A. Parayil, Ankur Mallick, Rujia Wang, Renee St. Amant, Chetan Bansal, Victor Ruehle, Saravan Rajmohan, Shashwat Jaiswal, Yogesh Simmhan, Anoop Kulkarni, Steve Kofsky
  
  ACM Sigmetrics 2026 | June 2026
  
  Publication Project
- Continuous Benchmark Generation for Evaluating Enterprise-scale LLM Agents
  
  Divyanshu Saxena, Rishikesh Maurya, Xiaoxuan Ou, Gagan Somashekar, Shachee Mishra Gupta, Arun Iyer, Yu Kang, Chetan Bansal, Aditya Akella, Saravan Rajmohan
  
  International Conference on Software Engineering Workshop on Large Language Models for Code | April 2026
  
  DOI Publication Publication
- Workload Intelligence: Workload-Aware IaaS Abstraction for Cloud Efficiency
  
  Lexiang Huang, A. Parayil, Jue Zhang, Xiaoting Qin, Chetan Bansal, Jovan Stojkovic, Pantea Zardoshti, Pulkit Misra, Eli Cortez, Raphael Ghelman, Íñigo Goiri, Saravan Rajmohan, Jim Kleewein, Rodrigo Fonseca, Timothy Zhu, Ricardo Bianchini
  
  International Conference for High Performance Computing, Networking, Storage, and Analysis (SC) | November 2025
  
  Publication
- ModServe: Modality- and Stage-Aware Resource Disaggregation for Scalable Multimodal Model Serving
  
  Haoran Qiu, Anish Biswas, Zihan Zhao, Jayashree Mohan, Alind Khare, Esha Choukse, Íñigo Goiri, Zeyu Zhang, Haiying Shen, Chetan Bansal, Ramachandran Ramjee, Rodrigo Fonseca
  
  ACM Symposium on Cloud Computing (SoCC) 2025 | November 2025
  
  Preprint Project Project
- Generative Caching for Structurally Similar Prompts and Responses
  
  Sarthak Chakraborty, Suman Nath, Xuchao Zhang, Chetan Bansal, Indranil Gupta
  
  NeurIPS 2025 | November 2025
  
  Preprint
- Triangle: Empowering Incident Triage with Multi-Agent
  
  Zhaoyang Yu, Aoyang Fang, Minghua Ma, Chaoyun Zhang, Ze Li, Murali Chintalapati, Xuchao Zhang, Rujia Wang, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, et.al
  
  ASE'25 | November 2025
  
  Publication Project
- REFA: Reference Free Alignment for multi-preference optimization
  
  Taneesh Gupta, Rahul Madhavan, Xuchao Zhang, Chetan Bansal, Saravan Rajmohan
  
  COLM 2025 | July 2025
  
  Publication
- ProtoRAIL: A Risk-cognizant Imitation Agent for Adaptive vCPU Oversubscription In The Cloud
  
  Lu Wang, Mayukh Das, Fangkai Yang, Bo Qiao, Hang Dong, Si Qin, Victor Ruehle, Chetan Bansal, Eli Cortez, Íñigo Goiri, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  MLSys'25 | May 2025
  
  Publication
- AIOpsLab: A Holistic Framework for Evaluating AI Agents for Enabling Autonomous Cloud
  
  Yinfang Chen, Manish Shetty, Gagan Somashekar, Minghua Ma, Yogesh Simmhan, Jonathan Mace, Chetan Bansal, Rujia Wang, Saravan Rajmohan
  
  MLSys '25 | May 2025
  
  Publication
- Towards Cloud Efficiency with Large-scale Workload Characterization
  
  A. Parayil, Jue Zhang, Xiaoting Qin, Íñigo Goiri, Chetan Bansal
  
  ICPE | May 2025
  
  Preprint
- Time Warp: The Gap Between Developers’ Ideal vs Actual Workweeks in an AI-Driven Era
  
  Sukrit Kumar, Drishti Goel, Tom Zimmermann, Brian Houck, B. Ashok, Chetan Bansal
  
  ICSE SEIP '25 | April 2025
  
  Distinguished Paper Award
  
  Preprint
- Performance Aware LLM Load Balancer for Mixed Workloads
  
  Kunal Jain, A. Parayil, Ankur Mallick, Esha Choukse, Xiaoting Qin, Jue Zhang, Íñigo Goiri, Rujia Wang, Chetan Bansal, Victor Ruehle, Anoop Kulkarni, Steve Kofsky, Saravan Rajmohan
  
  EuroMLSys 2025 | April 2025
  
  Publication Project
- Coach: Exploiting Temporal Patterns for All-Resource Oversubscription in Cloud Platforms
  
  Benjamin Reidys, Pantea Zardoshti, Íñigo Goiri, Celine Irvene, Daniel S. Berger, Haoran Ma, Kapil Arya, Taylor Stark, Eugene Bak, Mehmet Iyigun, Stanko Novakovic, Lisa Hsu, Karel Trueba, Abhisek Pan, Chetan Bansal, Saravan Rajmohan, Jian Huang, Ricardo Bianchini
  
  ASPLOS | March 2025
  
  Publication Project
- Anyprefer: An Agentic Framework for Preference Data Synthesis
  
  Yiyang Zhou, Zhaoyang Wang, Tianle Wang, Shangyu Xing, Peng Xia, Bo Li, Kaiyuan Zheng, Zijian Zhang, Zhaorun Chen, Wenhao Zheng, Xuchao Zhang, Chetan Bansal, Weitong Zhang, Ying Wei, Mohit Bansal, Huaxiu Yao
  
  ICLR 2025 | March 2025
  
  Publication PDF
- AMPO: Active Multi-Preference Optimization
  
  Taneesh Gupta, Rahul Madhavan, Xuchao Zhang, Chetan Bansal, Saravan Rajmohan
  
  ICML 2025 | February 2025
  
  DOI Publication Publication
- Verifiable Format Control for Large Language Model Generations
  
  Zhaoyang Wang, Jinqi Jiang, Huichi Zhou, Wenhao Zheng, Xuchao Zhang, Chetan Bansal, Huaxiu Yao
  
  NAACL | February 2025
  
  DOI Publication Publication
- Building AI Agents for Autonomous Clouds: Challenges and Design Principles
  
  Manisha M Shetty, Yinfang Chen, Gagan Somashekar, Minghua Ma, Yogesh L. Simmhan, Xuchao Zhang, Jonathan Mace, Pedro Las-Casas, Shachee Mishra Gupta, Suman Nath, Chetan Bansal, Saravan Rajmohan
  
  2024 Symposium on Cloud Computing | November 2024
  
  Publication
- CARMO: Dynamic Criteria Generation for Context-Aware Reward Modelling
  
  Taneesh Gupta, Shivam Shandilya, Xuchao Zhang, Supriyo Ghosh, Chetan Bansal, Huaxiu Yao, Saravan Rajmohan
  
  2024 Meeting of the Association for Computational Linguistics | October 2024
  
  Publication
- CREAM: Consistency Regularized Self-Rewarding Language Models
  
  Zhaoyang Wang, Weilei He, Zhiyuan Liang, Xuchao Zhang, Chetan Bansal, Ying Wei, Weitong Zhang, Huaxiu Yao
  
  ICLR 2025 | October 2024
  
  DOI Publication Publication
- Can We Trust Auto-Mitigation? Improving Cloud Failure Prediction with Uncertain Positive Learning
  
  Haozhe Li, Minghua Ma, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  2024 International Symposium on Software Reliability Engineering | October 2024
  
  Publication
- Early Bird: Ensuring Reliability of Cloud Systems Through Early Failure Prediction
  
  Yudong Liu, Minghua Ma, Pu Zhao, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  2024 International Symposium on Software Reliability Engineering | October 2024
  
  Publication
- COIN: Chance-Constrained Imitation Learning for Safe and Adaptive Resource Oversubscription under Uncertainty
  
  Lu Wang, Mayukh Das, Fangkai Yang, Chao Du, Bo Qiao, Hang Dong, Chetan Bansal, Si Qin, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang, Qi Zhang
  
  CIKM'24 | October 2024
  
  PDF
- Large Language Models Can Provide Accurate and Interpretable Incident Triage
  
  Zexin Wang, Minghua Ma, Ze Li, Chetan Bansal, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  2024 International Symposium on Software Reliability Engineering | August 2024
  
  Publication
- Automated Root Causing of Cloud Incidents using In-Context Learning with GPT-4
  
  Xuchao Zhang, Supriyo GHOSH, Chetan Bansal, Rujia Wang, Minghua Ma, Yu Kang, Saravan Rajmohan
  
  Foundations of Software Engineering (FSE) | July 2024
  
  Publication
- X-lifecycle Learning for Cloud Incident Management using LLMs
  
  Drishti Goel, Fiza Husain, Aditya Singh, Supriyo GHOSH, A. Parayil, Chetan Bansal, Xuchao Zhang, Saravan Rajmohan
  
  Foundations of Software Engineering (FSE) | July 2024
  
  Publication
- MonitorAssistant: Simplifying Cloud Service Monitoring via Large Language Models
  
  Zhaoyang Yu, Minghua Ma, Chaoyun Zhang, Si Qin, Yu Kang, Chetan Bansal, Saravan Rajmohan, Yingnong Dang, Changhua Pei, Dan Pei, Qingwei Lin 林庆维, Dongmei Zhang
  
  Foundations of Software Engineering (FSE) | July 2024
  
  DOI Publication
- MonitorAssistant: Simplifying Cloud Service Monitoring via Large Language Models
  
  Zhaoyang Yu, Minghua Ma, Chaoyun Zhang, Si Qin, Yu Kang, Chetan Bansal, Saravan Rajmohan, Yingnong Dang, Changhua Pei, Dan Pei, Qingwei Lin 林庆维, Dongmei Zhang
  
  ESEC/FSE'24 Industry Track | July 2024
  
  Publication Publication
- Exploring LLM-based Agents for Root Cause Analysis
  
  Devjeet Roy, Xuchao Zhang, Rashi Bhave, Chetan Bansal, Pedro Las-Casas, Rodrigo Fonseca, Saravan Rajmohan
  
  FSE '24: 32nd ACM International Conference on the Foundations of Software Engineering | July 2024
  
  Publication Project
- CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models
  
  Peng Xia, Ze Chen, Juanxi Tian, Yangrui Gong, Ruibo Hou, Yue Xu, Zhenbang Wu, Zhiyuan Fan, Yiyang Zhou, Kangyu Zhu, Wenhao Zheng, Zhaoyang Wang, Xiao Wang, Xuchao Zhang, Chetan Bansal, Marc Niethammer, Junzhou Huang, Hongtu Zhu, Yun Li, Jimeng Sun, Zongyuan Ge, Gang Li, James Zou, Huaxiu Yao
  
  NeurIPS 2024 | June 2024
  
  DOI Publication Publication
- Designing Cloud Servers for Lower Carbon
  
  Jaylen Wang, Daniel S. Berger, Fiodar Kazhamiaka, Celine Irvene, Chaojie Zhang, Esha Choukse, Kali Frost, Rodrigo Fonseca, Brijesh Warrier, Chetan Bansal, Jonathan Stern, Ricardo Bianchini, Akshitha Sriraman
  
  ISCA | June 2024
  
  Publication
- SmartOClock: Workload- and Risk-Aware Overclocking in the Cloud
  
  Jovan Stojkovic, Pulkit Misra, Íñigo Goiri, Sam Whitlock, Esha Choukse, Mayukh Das, Chetan Bansal, Jason Lee, Zoey Sun, Haoran Qiu, Reed Zimmermann, Savyasachi Samal, Brijesh Warrier, Ashish Raniwala, Ricardo Bianchini
  
  ISCA | June 2024
  
  Publication
- Dependency Aware Incident Linking in Large Cloud Systems
  
  Supriyo GHOSH, Karish Grover, Jimmy Wong, Chetan Bansal, Rakesh Namineni, Mohit Verma, Saravan Rajmohan
  
  The Web Conference (WWW) | May 2024
  
  Publication
- Intelligent Overclocking for Improved Cloud Efficiency
  
  Aditya Soni, Mayukh Das, Pulkit Misra, Chetan Bansal
  
  AIOps '24 workshop @ ASPLOS [5th International Workshop on Cloud Intelligence / AIOps] | April 2024
  
  Preprint
- Intelligent Monitoring Framework for Cloud Services: A Data-Driven Approach
  
  Pooja Srinivas, Fiza Husain, A. Parayil, Ayush Choure, Chetan Bansal, Saravan Rajmohan
  
  46th International Conference on Software Engineering: Software Engineering in Practice (ICSE-SEIP’24) | April 2024
  
  Preprint
- AutoARTS: Taxonomy, Insights and Tools for Root Cause Labelling of Incidents in Microsoft Azure
  
  Pradeep Dogga, Chetan Bansal, Richard Costleigh, Gopinath Jayagopal, Suman Nath, Xuchao Zhang
  
  2023 USENIX Annual Technical Conference | July 2023
  
  Publication Project
- How Different are the Cloud Workloads? Characterizing Large-Scale Private and Public Cloud Workloads
  
  Xiaoting Qin, Minghua Ma, Yueng Zhao, Jue Zhang, Chao Du, Yudong Liu, A. Parayil, Chetan Bansal, Saravan Rajmohan, Íñigo Goiri, Eli Cortez, Si Qin, Qingwei Lin 林庆维, Dongmei Zhang
  
  DSN'23 | June 2023
  
  Publication
- Recommending Root-Cause and Mitigation Steps for Cloud Incidents using Large Language Models
  
  Toufique Ahmed, Supriyo GHOSH, Chetan Bansal, Tom Zimmermann, Xuchao Zhang, Saravan Rajmohan
  
  ICSE 2023 | May 2023
  
  Publication
- Snape: Reliable and Low-Cost Computing with Mixture of Spot and On-Demand VMs
  
  Fangkai Yang, Lu Wang, Zhenyu Xu, Jue Zhang, Liqun Li, Bo Qiao, Camille Couturier, Chetan Bansal, Soumya Ram, Si Qin, Zhen Ma, Íñigo Goiri, Eli Cortez, Terry Yang, Victor Ruehle, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  ASPLOS'23 | March 2023
  
  Publication
- AutoTSG: Learning and Synthesis for Incident Troubleshooting
  
  Manish Shetty, Chetan Bansal, Sai Pramod Upadhyayula, Arjun Radhakrishna, Anurag Gupta
  
  ESEC/FSE 2022 | November 2022
  
  Publication Publication Publication
- How to Fight Production Incidents? An Empirical Study on a Large-scale Cloud Service
  
  Supriyo GHOSH, Manish Shetty, Chetan Bansal, Suman Nath
  
  SoCC 2022 | November 2022
  
  Best Paper Award
  
  Publication PDF Project
- Characterizing the Usage of CI Tools in ML Projects
  
  Dhia Elhaq Rzig, Foyzul Hassan, Chetan Bansal, Nachiappan Nagappan
  
  ESEM 2022 | September 2022
  
  Publication
- DeepAnalyze: Learning to Localize Crashes at Scale
  
  Manish Shetty, Chetan Bansal, Suman Nath, Sean Bowles, Henry Wang, Ozgur Arman, Siamak Ahari
  
  ICSE 2022 | May 2022
  
  Publication Project
- Spot Virtual Machine Eviction Prediction in Microsoft Cloud
  
  Fangkai Yang, Bowen Pang, Jue Zhang, Bo Qiao, Lu Wang, Camille Couturier, Chetan Bansal, Soumya Ram, Si Qin, Zhen Ma, Íñigo Goiri, Eli Cortez, Senthil Baladhandayutham, Victor Rühle, Saravan Rajmohan, Qingwei Lin 林庆维, Dongmei Zhang
  
  WWW'22 Companion | April 2022
  
  Publication
- Micro-climate Prediction – Multi Scale Encoder-decoder based Deep Learning Framework
  
  Peeyush Kumar, Ranveer Chandra, Chetan Bansal, Shivkumar Kalyanaraman, Tanuja Ganu, Michael Grant
  
  2021 Knowledge Discovery and Data Mining | August 2021
  
  Publication Publication Project Project
- Search4Code: Code Search Intent Classification Using Weak Supervision
  
  Nikitha Rao, Chetan Bansal, Joe Guan
  
  Mining Software Repositories (MSR '21) | May 2021
  
  PDF
- Neural Knowledge Extraction From Cloud Service Incidents
  
  Manish Shetty, Chetan Bansal, Sumit Kumar, Nikitha Rao, Nachiappan Nagappan, Tom Zimmermann
  
  43rd International Conference on Software Engineering (ICSE '21) - SEIP Track | May 2021
- Analyzing Web Search Behavior for Software Engineering Tasks
  
  Nikitha Rao, Chetan Bansal, Tom Zimmermann, Ahmed Awadallah, Nachi Nagappan
  
  IEEE BigData | December 2020
  
  PDF
- Product Insights: Analyzing Product Intents in Web Search
  
  Nikitha Rao, Chetan Bansal, Subhabrata (Subho) Mukherjee, Chandra Maddila
  
  CIKM 2020 | October 2020
  
  Publication
- Studying Ransomware Attacks Using Web Search Logs
  
  Chetan Bansal, Pantazis Deligiannis, Chandra Maddila, Nikitha Rao
  
  SIGIR 2020 | July 2020
  
  Publication
- An Empirical Study of Software Exceptions in the Field using Search Logs
  
  Foyzul Hassan, Chetan Bansal, Nachi Nagappan, Tom Zimmermann, Ahmed Awadallah
  
  ESEM 2020 | July 2020
  
  Publication
- Angelic Checking within Static Driver Verifier: Towards high-precision defects without (modeling) cost
  
  Shuvendu Lahiri, Akash Lal, Sridhar Gopinath, Alexander Nutz, Vladimir Levin, Rahul Kumar, Nate Deisinger, Jakob Lichtenberg, Chetan Bansal
  
  FMCAD | July 2020
  
  Best paper award
  
  Publication Video Project Project
- DeCaf: Diagnosing and Triaging Performance Issues in Large-Scale Cloud Services
  
  Chetan Bansal, Sundararajan Renganathan, Ashima Asudani, Olivier Midy, Mathru Janakiraman
  
  ICSE 2020 | May 2020
  
  PDF Project
- Rex: Preventing Bugs and Misconfiguration in Large Services using Correlated Change Analysis
  
  Sonu Mehta, Ranjita Bhagwan, Rahul Kumar, B. Ashok, Chetan Bansal, Chandra Maddila, Christian Bird, Sumit Asthana, Aditya Kumar
  
  Networked System Design and Implementation (NSDI) | February 2020
  
  Publication Project
- Leveraging Change Intents for Characterizing and Identifying Large-Review-Effort Changes
  
  Song Wang, Chetan Bansal, Nachi Nagappan, Adithya Abraham Philip
  
  PROMISE 2019 | September 2019
  
  Publication Project
- WhoDo: Automating Reviewer Suggestions at Scale
  
  Sumit Asthana, Rahul Kumar, Ranjita Bhagwan, Chetan Bansal, Christian Bird, Chandra Maddila, Sonu Mehta, B. Ashok
  
  ESEC/FSE 2019 | August 2019
  
  Publication Project
- Predicting Pull Request Completion Time: A Case Study on Large Scale Cloud Services
  
  Chandra Maddila, Chetan Bansal, Nachi Nagappan
  
  ESEC/FSE 2019 | August 2019
  
  Publication Project
- Building sankie: an AI platform for DevOps
  
  Rahul Kumar, Chetan Bansal, Chandra Maddila, Nitin Sharma, Shawn Martelock, Ravi Bhargava
  
  1st International Workshop on Bots in Software Engineering (BotSE '19) | May 2019
  
  Publication Project
- Hashtag Recommendation for Enterprise Applications
  
  Dhruv Mahajan , Vishwajit Kolathur , Chetan Bansal, Sundararajan Sellamanickam, Johannes Gehrke, Sathiya Keerthi , Suresh Parthasarathy
  
  CIKM | October 2016
  
  Publication
- CloudSDV: Enabling Static Driver Verifier using Microsoft Azure
  
  Rahul Kumar, Thomas Ball, Jakob Lichtenberg, Nate Deisinger, Apoorv Upreti, Chetan Bansal
  
  IFM 2016 Proceedings of the 12th International Conference on Integrated Formal Methods | June 2016
  
  ISBN: 978-3-319-33692-3
  
  Publication Publication
- Cache Timing Attacks Revisited: Efficient and Repeatable Browser History, OS and Network Sniffing
  
  Chetan Bansal, Sören Preibusch, Natasa Milic-Frayling
  
  IFIP International Information Security Conference | May 2015
  
  Publication Publication
- Keys to the Cloud: Formal Analysis and Concrete Attacks on Encrypted Web Storage
  
  Chetan Bansal, Karthikeyan Bhargavan, Antoine Delignat-Lavaud, Sergio Maffeis
  
  2nd Conference on Principles of Security and Trust (POST 2013) | January 2013
  
  Publication
- Discovering Concrete Attacks on Website Authorization by Formal Analysis
  
  Chetan Bansal, Karthikeyan Bhargavan, Sergio Maffeis
  
  25th IEEE Computer Security Foundations Symposium (CSF'12) | June 2012
  
  Publication Publication
- AutoAdapt: An Automated Domain Adaptation Framework for LLMs
  
  Sidharth Sinha, Anson Bastos, Xuchao Zhang, Akshay Nambi, Chetan Bansal, Saravan Rajmohan
  
  March 2026
  
  Publication
- Adapting Web Agents with Synthetic Supervision
  
  Zhaoyang Wang, Yiming Liang, Xuchao Zhang, Qianhui Wu, Siwei Han, Anson Bastos, Rujia Wang, Chetan Bansal, Baolin Peng, Jianfeng Gao, Saravan Rajmohan, Huaxiu Yao
  
  November 2025
  
  Publication Project
- Attention Enhanced Entity Recommendation for Intelligent Monitoring in Cloud Systems
  
  Fiza Hussain, Anson Bastos, A. Parayil, Ayush Choure, Chetan Bansal, Rujia Wang, Saravan Rajmohan
  
  October 2025
  
  Publication
- ModServe: Scalable and Resource-Efficient Large Multimodal Model Serving
  
  Haoran Qiu, Anish Biswas, Zihan Zhao, Jayashree Mohan, Alind Khare, Esha Choukse, Íñigo Goiri, Zeyu Zhang, Haiying Shen, Chetan Bansal, Ramachandran Ramjee, Rodrigo Fonseca
  
  February 2025
  
  Publication Project Project
- Memora: A Harmonic Memory Representation Balancing Abstraction and Specificity
  
  Menglin Xia, Xuchao Zhang, Shantanu Dixit, Paramaguru Harimurugan, Rujia Wang, Victor Ruehle, Robert Sim, Chetan Bansal, Saravan Rajmohan
  
  March 2026
  
  Preprint
- AgentRx: Diagnosing AI Agent Failures from Execution Trajectories
  
  Shraddha Barke, Arnav Goyal, Alind Khare, Avaljot Singh, Suman Nath, Chetan Bansal
  
  February 2026
  
  Preprint
- SUTRADHARA : An Intelligent Orchestrator-Engine Co-design for Tool-based Agentic Inference
  
  Anish Biswas, Kanishk Goel, Jayashree Mohan, Alind Khare, A. Parayil, Ramachandran Ramjee, Chetan Bansal
  
  February 2026
  
  Preprint Project
- FLASH: A Workflow Automation Agent for Diagnosing Recurring Incidents
  
  Xuchao Zhang, Tanish Mittal, Chetan Bansal, Rujia Wang, Minghua Ma, Zhixin Ren, Hao Huang, Saravan Rajmohan
  
  October 2024
  
  Publication Project
- PACE-LM: Prompting and Augmentation for Calibrated Confidence Estimation with GPT-4 in Cloud Incident Root Cause Analysis
  
  Dylan Zhang, Xuchao Zhang, Chetan Bansal, Pedro Las-Casas, Rodrigo Fonseca, Saravan Rajmohan
  
  September 2023
  
  Publication
- Automated Service Design with Cerulean (Project Showcase)
  
  Vaastav Anand, Alok Kumbhare, Celine Irvene, Chetan Bansal, Gagan Somashekar, Jonathan Mace, Pedro Las-Casas, Ricardo Bianchini, Rodrigo Fonseca
  
  2025 IEEE/ACM International Workshop on Cloud Intelligence & AIOps (AIOps) | May 2025, pp. 1-3
  
  DOI Publication
- Synergistic Weak-Strong Collaboration by Aligning Preferences
  
  Yizhu Jiao, Xuchao Zhang, Zhaoyang Wang, Yubo Ma, Zhun Deng, Rujia Wang, Chetan Bansal, Saravan Rajmohan, Jiawei Han, Huaxiu Yao
  
  ArXiv | April 2025, Vol abs/2504.15188
  
  DOI Publication Publication
- Intent-based System Design and Operation
  
  Vaastav Anand, Yichen Li, Alok Kumbhare, Celine Irvene, Chetan Bansal, Gagan Somashekar, Jonathan Mace, Pedro Las-Casas, Ricardo Bianchini, Rodrigo Fonseca
  
  Proceedings of the 4th Workshop on Practical Adoption Challenges of ML for Systems | February 2025
  
  DOI Publication Publication
- Ensuring Fair LLM Serving Amid Diverse Applications
  
  Kunal Jain, Ankur Mallick, A. Parayil, Renee St. Amant, Rujia Wang, Victor Ruehle, Chetan Bansal, Saravan Rajmohan, Redwan Ibne Seraj Khan, Haiying Shen, Anoop Kulkarni, Steve Kofsky, Pankhuri Choudhary, Yue Cheng
  
  ArXiv | November 2024
  
  Publication Project
- Intelligent Router for LLM Workloads: Improving Performance Through Workload-Aware Scheduling
  
  A. Parayil, Ankur Mallick, Esha Choukse, Xiaoting Qin, Jue Zhang, Íñigo Goiri, Rujia Wang, Chetan Bansal, Victor Ruehle, Saravan Rajmohan, Kunal Jain, Anoop Kulkarni, Steve Kofsky
  
  ArXiv | August 2024, Vol abs/2408.13510
  
  Preprint
- Workload Intelligence: Punching Holes Through the Cloud Abstraction
  
  Lexiang Huang, A. Parayil, Jue Zhang, Xiaoting Qin, Chetan Bansal, Jovan Stojkovic, Pantea Zardoshti, Pulkit Misra, Eli Cortez, Raphael Ghelman, Íñigo Goiri, Saravan Rajmohan, Jim Kleewein, Rodrigo Fonseca, Timothy Zhu, Ricardo Bianchini
  
  ArXiv | April 2024, Vol abs/2404.19143
  
  Preprint
- Workload Intelligence: Punching Holes Through the Cloud Abstraction
  
  Lexiang Huang, A. Parayil, Jue Zhang, Xiaoting Qin, Chetan Bansal, Jovan Stojkovic, Pantea Zardoshti, Pulkit Misra, Eli Cortez, Raphael Ghelman, Íñigo Goiri, Saravan Rajmohan, Jim Kleewein, Rodrigo Fonseca, Timothy Zhu, Ricardo Bianchini
  
  April 2024
  
  Preprint
- SoftNER: Mining knowledge graphs from Cloud Incidents
  
  Manish Shetty, Chetan Bansal, Sumit Kumar, Nikitha Rao, Nachiappan Nagappan
  
  Empirical Software Engineering | April 2022, Vol 27(4)
  
  Publication
- Large-Scale Intent Analysis for Identifying Large-Review-Effort Code Changes
  
  Song Wang, Chetan Bansal, Nachi Nagappan
  
  Information and Software Technology | February 2021, Vol 130
  
  Publication
- Discovering concrete attacks on website authorization by formal analysis
  
  Chetan Bansal, Karthikeyan Bhargavan, Antoine Delignat-Lavaud, Sergio Maffeis
  
  Journal of Computer Security | July 2014, Vol 22: pp. 601-657
  
  Publication Publication
- Massively Empowered Classroom: Enhancing Technical Education in India
  
  Ed Cutrell, Srinath Bala, Chetan Bansal, Andrew Cross, Naren Datha, Aldo John, Rahul Kumar, Madhusudan Parthasarathy, Siddharth Prakash, Sriram Rajamani, Bill Thies
  
  MSR-TR-2013-127 | December 2013
  
  Publication

Chetan Bansal

Publications

Serving Models, Fast and Slow:Optimizing Heterogeneous LLM Inferencing Workloads at Scale

Continuous Benchmark Generation for Evaluating Enterprise-scale LLM Agents

AutoAdapt: An Automated Domain Adaptation Framework for LLMs

Memora: A Harmonic Memory Representation Balancing Abstraction and Specificity

AgentRx: Diagnosing AI Agent Failures from Execution Trajectories

SUTRADHARA : An Intelligent Orchestrator-Engine Co-design for Tool-based Agentic Inference

Workload Intelligence: Workload-Aware IaaS Abstraction for Cloud Efficiency

ModServe: Modality- and Stage-Aware Resource Disaggregation for Scalable Multimodal Model Serving

Adapting Web Agents with Synthetic Supervision

Generative Caching for Structurally Similar Prompts and Responses

Triangle: Empowering Incident Triage with Multi-Agent

Attention Enhanced Entity Recommendation for Intelligent Monitoring in Cloud Systems

REFA: Reference Free Alignment for multi-preference optimization

AIOpsLab: A Holistic Framework for Evaluating AI Agents for Enabling Autonomous Cloud

ProtoRAIL: A Risk-cognizant Imitation Agent for Adaptive vCPU Oversubscription In The Cloud

Towards Cloud Efficiency with Large-scale Workload Characterization

Automated Service Design with Cerulean (Project Showcase)

Time Warp: The Gap Between Developers’ Ideal vs Actual Workweeks in an AI-Driven Era

Synergistic Weak-Strong Collaboration by Aligning Preferences

Performance Aware LLM Load Balancer for Mixed Workloads

Coach: Exploiting Temporal Patterns for All-Resource Oversubscription in Cloud Platforms

Anyprefer: An Agentic Framework for Preference Data Synthesis

AMPO: Active Multi-Preference Optimization

Intent-based System Design and Operation

Verifiable Format Control for Large Language Model Generations

ModServe: Scalable and Resource-Efficient Large Multimodal Model Serving

Ensuring Fair LLM Serving Amid Diverse Applications

Building AI Agents for Autonomous Clouds: Challenges and Design Principles

CARMO: Dynamic Criteria Generation for Context-Aware Reward Modelling

CREAM: Consistency Regularized Self-Rewarding Language Models

Can We Trust Auto-Mitigation? Improving Cloud Failure Prediction with Uncertain Positive Learning

COIN: Chance-Constrained Imitation Learning for Safe and Adaptive Resource Oversubscription under Uncertainty

Early Bird: Ensuring Reliability of Cloud Systems Through Early Failure Prediction

FLASH: A Workflow Automation Agent for Diagnosing Recurring Incidents

Intelligent Router for LLM Workloads: Improving Performance Through Workload-Aware Scheduling

Large Language Models Can Provide Accurate and Interpretable Incident Triage

Automated Root Causing of Cloud Incidents using In-Context Learning with GPT-4

X-lifecycle Learning for Cloud Incident Management using LLMs

MonitorAssistant: Simplifying Cloud Service Monitoring via Large Language Models

Exploring LLM-based Agents for Root Cause Analysis

MonitorAssistant: Simplifying Cloud Service Monitoring via Large Language Models

CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models

Designing Cloud Servers for Lower Carbon

SmartOClock: Workload- and Risk-Aware Overclocking in the Cloud

Dependency Aware Incident Linking in Large Cloud Systems

Intelligent Overclocking for Improved Cloud Efficiency

Intelligent Monitoring Framework for Cloud Services: A Data-Driven Approach

Workload Intelligence: Punching Holes Through the Cloud Abstraction

Workload Intelligence: Punching Holes Through the Cloud Abstraction

PACE-LM: Prompting and Augmentation for Calibrated Confidence Estimation with GPT-4 in Cloud Incident Root Cause Analysis

AutoARTS: Taxonomy, Insights and Tools for Root Cause Labelling of Incidents in Microsoft Azure

How Different are the Cloud Workloads? Characterizing Large-Scale Private and Public Cloud Workloads

Recommending Root-Cause and Mitigation Steps for Cloud Incidents using Large Language Models

Snape: Reliable and Low-Cost Computing with Mixture of Spot and On-Demand VMs

AutoTSG: Learning and Synthesis for Incident Troubleshooting

How to Fight Production Incidents? An Empirical Study on a Large-scale Cloud Service

Characterizing the Usage of CI Tools in ML Projects

DeepAnalyze: Learning to Localize Crashes at Scale

SoftNER: Mining knowledge graphs from Cloud Incidents

Spot Virtual Machine Eviction Prediction in Microsoft Cloud

Micro-climate Prediction – Multi Scale Encoder-decoder based Deep Learning Framework

Neural Knowledge Extraction From Cloud Service Incidents

Search4Code: Code Search Intent Classification Using Weak Supervision

Large-Scale Intent Analysis for Identifying Large-Review-Effort Code Changes

Analyzing Web Search Behavior for Software Engineering Tasks

Product Insights: Analyzing Product Intents in Web Search

An Empirical Study of Software Exceptions in the Field using Search Logs

Angelic Checking within Static Driver Verifier: Towards high-precision defects without (modeling) cost

Studying Ransomware Attacks Using Web Search Logs

DeCaf: Diagnosing and Triaging Performance Issues in Large-Scale Cloud Services

Rex: Preventing Bugs and Misconfiguration in Large Services using Correlated Change Analysis

Leveraging Change Intents for Characterizing and Identifying Large-Review-Effort Changes

WhoDo: Automating Reviewer Suggestions at Scale

Predicting Pull Request Completion Time: A Case Study on Large Scale Cloud Services

Building sankie: an AI platform for DevOps

Hashtag Recommendation for Enterprise Applications

CloudSDV: Enabling Static Driver Verifier using Microsoft Azure

Cache Timing Attacks Revisited: Efficient and Repeatable Browser History, OS and Network Sniffing