Human language technologies

Researching software and systems that bridge the linguistic divide between people and machines to make communicating with computers as natural as speaking with family and friends.

Lydia Nishimwe's MSR Africa, Nairobi seminar

Making Sentence Embeddings Robust to User-Generated Content | Video

Microsoft Research Forum | Episode 3 | Daniela Massiceti

Insights into the Challenges and Opportunities of Large Multi-Modal Models for Blind and Low Vision Users: CLIP

Project GraphRAG | LLM-Derived Knowledge Graphs

Microsoft Research Forum | Episode 3 | panel discussion

PARIKSHA: A Scalable, Democratic, Transparent Evaluation Platform for Assessing Indic Large Language Models

Current selections

Sort by: Most recent

Clear selections

Search within these results

Content Types

People

Jianfeng Gao (195)

Jinyu Li (181)

Furu Wei (108)

Chin-Yew Lin (104)

Yifan Gong (92)

Kalika Bali (71)

Michel Galley (70)

Sunayana Sitaram (55)

Sarangarajan Parthasarathy (50)

Shujie Liu (49)

Chris Quirk (44)

Lei Cui (44)

Xiaodong Liu (41)

Dan Bohus (40)

Xiaofei Wang (39)

Shuohang Wang (32)

Weizhu Chen (30)

Sudha Rao (28)

Li Dong (28)

Lijuan Wang (26)

Nan Yang (26)

Qianhui Wu (26)

Dongdong Zhang (25)

Dongmei Zhang (24)

Yang Liu (24)

Ivan Tashev (22)

Liang Wang (22)

Sujay Kumar Jauhar (20)

Shaohan Huang (19)

Eric Horvitz (18)

Yu Shi (18)

Yeyun Gong (17)

Hao Cheng (17)

Michael Xu (17)

Weijia Xu (17)

Hoifung Poon (16)

Michael Levit (16)

Hannes Schulz (16)

Ben Van Durme (16)

Yuqing Yang (16)

Jorge J. G. Leandro (16)

Ryen W. White (15)

Yao Qian (15)

Xingdi Yuan (15)

Tanuja Ganu (15)

Linjun Shou (寿林钧) (15)

Hsiao-Wuen Hon (14)

Nebojsa Jojic (14)

Shi Han (14)

Xing Xie (14)

Yan Huang (14)

Budhaditya Deb (14)

Tengchao Lv (14)

Millicent Ochieng (14)

Lars Liden (13)

Manik Varma (13)

Hanna Wallach (13)

Fangzhao Wu (12)

Advait Sarkar (12)

Xia Song (12)

Xufang Luo (12)

Robert Sim (11)

Hamed Khanpour (11)

Xiubo Geng (11)

Dongsheng Li (11)

Milad Shokouhi (10)

Yaobo Liang (10)

Shikhar Sharma (10)

Linjie Li (10)

Cha Zhang (9)

Jacki O'Neill (9)

Nick Craswell (9)

Bo-June (Paul) Hsu (9)

Qiang Huo (9)

Yi Mao (9)

Young Jin Kim (9)

Rangan Majumder (9)

Manthan Thakker (9)

Sam Thomson (9)

Amit Sharma (8)

Paul Smolensky (8)

Alessandro Sordoni (8)

Sheng Zhang (8)

Barun Patra (8)

Corby Rosset (8)

Harsh Jhamtani (8)

Adam Fourney (7)

Dinei Florencio (7)

Qingwei Lin 林庆维 (7)

Sean Rintel (7)

Guoxin Wang (7)

Tristan Naumann (7)

Robert Gmyr (7)

Danqing Huang (7)

Kevin Larson (7)

Xingxing Zhang (7)

Akiko I. Eriguchi (7)

Dasha Metropolitansky (7)

Maximiliana Behnke (7)

Scott Counts (6)

Ed Cutrell (6)

Hannes Gamper (6)

Marc-Alexandre Côté (6)

Swadheen Shukla (6)

Sheng Zhao (6)

Zinan Lin (6)

Ece Kamar (5)

Jonathan Larson (5)

Henrique S. Malvar (5)

Pallavi Choudhury (5)

Sriram Rajamani (5)

Sumit Gulwani (5)

Swami Manohar (5)

Solon Barocas (5)

Adam Atkinson (5)

Mahmoud Adada (5)

Oscar Koller (5)

Mohit Jain (5)

Longqi Yang (5)

Bahar Sarrafzadeh (5)

Kevin Lin (5)

Dongdong Chen (5)

Peidong Wang (5)

Xiaoyuan Yi (5)

Jennifer Neville (5)

Manish Gupta (4)

John Langford (4)

Navin Goyal (4)

Sumit Basu (4)

Jaime Teevan (4)

Marcin Junczys-Dowmunt (4)

Akshay Nambi (4)

Cliff Wong (4)

Sunit Sivasankaran (4)

Mohamed Ahmed (4)

Noel Codella (4)

Sara Abdali (4)

Reshmi Ghosh (4)

Patrick Xia (4)

Baolin Peng (4)

Ambrosio Blanco (3)

Anton Schwaighofer (3)

Ahmed Tawfik (3)

Darren Edge (3)

Emre Kiciman (3)

Fan Yang (3)

Jennifer Wortman Vaughan (3)

Jianlong Fu (3)

Jack W. Stokes (3)

Katja Hofmann (3)

Kate Crawford (3)

Lei Ji (3)

Lidong Zhou (3)

Mark Encarnación (3)

Nirupama Chandrasekaran (3)

Silviu Cucerzan (3)

Vishal Chowdhary (3)

Ben Zorn (3)

Anja Thieme (3)

Paul Thomas (3)

Harsha Simhadri (3)

Sean Andrist (3)

Mihaela Vorvoreanu (3)

Qi Chen (3)

Haoyu Dong (3)

Dimitra Emmanouilidou (3)

Jiang Bian (3)

Naoto Usuyama (3)

Kenichi Kumatani (3)

Mengting Wan (3)

Zeqi Lin (3)

Rui Wang (3)

Jingwen Lu (3)

Amir Kantor (3)

Jack Williams (3)

Chad Atalla (3)

Andrea Tupini (3)

Huseyin Inan (3)

Najeeb G. Abdulhamid (3)

Victor Ruehle (3)

Saravan Rajmohan (3)

Jue Zhang (3)

Menglin Xia (3)

Xuchao Zhang (3)

Yuancheng Tu (3)

Lev Tankelevitch (3)

Chen Liang (3)

Achraf Chalabi (2)

Amit Deshpande (2)

Ashley Feniello (2)

Chetan Bansal (2)

Chris White (2)

Christopher Bishop (2)

Christophe Poulain (2)

David Johnston (2)

Doug Burger (2)

Bin Li (2)

Madan Musuvathi (2)

Matthai Philipose (2)

Michel Pahud (2)

Venkat Padmanabhan (2)

Peter Lee (2)

Richard Banks (2)

Rick Rogahn (2)

Suresh Parthasarathy (2)

Yan Xia (2)

Yeye He (2)

Yue Dong (2)

Iris Shen (2)

Chinmay Singh (2)

Pat Sweeney (2)

Vibhav Vineet (2)

Bo Qiao (2)

Esha Ghosh (2)

Tobias Schnabel (2)

Pu Zhao (2)

Bei Liu (2)

P. Anandan (2)

Brent Hecht (2)

Vu Le (2)

Xenofon Foukas (2)

Juan M. Lavista Ferres (2)

Aaron L Halfaker (2)

Ida Momennejad (2)

Ashley J. Llorens (2)

Ran Jia (2)

Dean Carignan (2)

Liang Du (2)

Eyal Kolman (2)

Robert Osazuwa Ness (2)

Alex Lu (2)

Serena Hillman (2)

Jiahang Xu (2)

Chung-Ching Lin (2)

Andres Codas (2)

Rujia Wang (2)

Shweti Mahajan (2)

Ade Famoti (2)

Kavyansh Chourasia (2)

Steven Truitt (2)

Ha Trinh (2)

Joshua Bradley (2)

Yupan Huang (2)

Flora Liu (2)

Guanghui Qin (2)

Pei Zhou (2)

Ashish Sharma (2)

Philippe Laban (2)

Emily Sheng (2)

Jean Garcia-Gathright (2)

Pranjal Chitale (2)

Gaurav Verma (2)

Vineeth N Balasubramanian (2)

Sheshera Mysore (2)

Debarati Das (2)

Payod Panda (2)

Andrew Blake (1)

Andreas Bode (1)

Ajay Manchepalli (1)

A.J. Brush (1)

Akshay Krishnamurthy (1)

Alvin Chen (1)

Andrzej Pastusiak (1)

Anne Loomis Thompson (1)

Ann Paradiso (1)

Anoop Gupta (1)

Abigail Sellen (1)

Aviv Hurvitz (1)

Andrew D. Wilson (1)

Victor Bahl (1)

Baining Guo (1)

Josh Benaloh (1)

Christian Borgs (1)

Bozidar Radunovic (1)

Jonathan M. Carlson (1)

Christian Bird (1)

Cecily Morrison (1)

Arnd Christian König (1)

Chris Sienkiewicz (1)

Chong Luo (1)

Christian Paquin (1)

David Sweeney (1)

Dong Chen (1)

Gopal Srinivasa (1)

Haidong Zhang (1)

David Heckerman (1)

Íñigo Goiri (1)

Jaron Lanier (1)

Jennifer Chayes (1)

Jonathan "Peli" de Halleux (1)

Jingjing Fu (1)

John Tang (1)

Rui Ding (1)

Kori Inkpen (1)

Laurent Bussard (1)

Lev Nachmanson (1)

Lily Sun (1)

Melissa Chase (1)

Michel Naim Gerguis (1)

Martin Grayson (1)

Neel Joshi (1)

Neeraj Kayal (1)

Nikunj Raghuvanshi (1)

Nikhil Swamy (1)

Peng Cheng (1)

Piali Choudhury (1)

Ravishankar Krishnaswamy (1)

Ramachandran Ramjee (1)

Ranveer Chandra (1)

Rick Rashid (1)

Ricardo Bianchini (1)

Santiago Zanella-Béguelin (1)

Sasa Junuzovic (1)

Shamsi Iqbal (1)

Shuo Chen (1)

Shuvendu Lahiri (1)

Siân Lindley (1)

Siddhartha Sen (1)

Sarah Bird (1)

Srinath Setty (1)

Suman Nath (1)

Surajit Chaudhuri (1)

Suresh Thummalapenta (1)

Tarleton Gillespie (1)

Xin Ma (1)

Yang Liu (1)

Sergey Yekhanin (1)

Yuan-Jyue Chen (1)

Zhitao Hou (1)

Shital Shah (1)

Bichlien Nguyen (1)

Ramakrishna Bairi (1)

Ankit Garg (1)

Li Zhao (1)

Arun Iyer (1)

Camilla Longden (1)

Darrin Eide (1)

Bryan Tower (1)

Qi Dai (1)

Jacob Alber (1)

Rahee Ghosh Peshawaria (1)

Nagarajan Natarajan (1)

Raluca Stevenson (1)

Sitaram Lanka (1)

Nipun Kwatra (1)

Sebastian Braun (1)

Sonu Mehta (1)

Yun Wang (1)

Qianxi Zhang (1)

Xiaowu Hu (1)

Zhirong Wu (1)

Zhixiong Niu (1)

Dave Bignell (1)

Eduardo Salinas (1)

Stephanie Hyland (1)

Jianxun Lian (1)

Carmen Badea (1)

Denae Ford (1)

Lukas Wutschitz (1)

Radames Cruz Moreno (1)

Ran Gilad-Bachrach (1)

Nathan Myhrvold (1)

Bamdev Mishra (1)

Kieran McDonald (1)

Danny Simmons (1)

Shruthi Bannur (1)

Carolyn Buractaon (1)

Yu Kang (1)

Arjun Radhakrishna (1)

Yiwen Zhu (1)

Ammar Ahmad Awan (1)

Vishak Gopal (1)

Rohit Pillai (1)

Daniel Coelho de Castro (1)

Sangeetha Shekar (1)

Felipe Oviedo (1)

Anna Pavlenko (1)

Joyce Cahoon (1)

Brian Kroth (1)

Jidong Long (龙继东) (1)

Alec Berntson (1)

Kunho Kim (1)

Rui Wang (1)

Stojan Trajanovski (1)

Samuel Chege Maina (1)

Xiyang Dai (1)

Esha Choukse (1)

Daniel Madrigal (1)

Mirian Hipolito Garcia (1)

Jason (Zengzhong) Li (1)

Ross Cutler (1)

Jesús Camacho-Rodríguez (1)

Sara Malvar (1)

Leonardo Nunes (1)

Robin Abraham (1)

Sameer Segal (1)

Jake Smith (1)

Jayashree Mohan (1)

Daniel Jones (1)

Maximilian Ilse (1)

Tommy Guy (1)

Yashoteja Prabhu (1)

Arnaud Flutre (1)

A J (HE/HIM) (1)

Chenglong Wang (1)

Michal Sroka (1)

Alejandro Gutierrez Munoz (1)

Luna K. Qiu (1)

Allie Giddings (1)

Jeevana Priya Inala (1)

Yansen Wang (1)

Darren Tanner (1)

Harsha Nori (1)

Fernando Pérez-García (1)

Krishna Doss Mohan (1)

Harkirat Behl (1)

Xiaoyu Liu (1)

Harshita Sharma (1)

James Devine (1)

Caihua Shan (1)

Yuge Zhang (1)

Xinyang Jiang (1)

Xiao Liu (1)

Morris Sharp (1)

Bonnie Kruft (1)

Jing Yao (1)

Chris Parnin (1)

Judith Amores (1)

Si Qin (1)

Tara Safavi (1)

Nan Chen (1)

Mukul Singh (1)

Chandan Singh (1)

Hosein Hasanbeig (1)

Bruno Silva (1)

Dan Vann (1)

Dongqi Han (1)

Yifei Shen (1)

Matheus Pereira (1)

Saksham Singhal (1)

Sergio Valcarcel Macua (1)

Christian Poelitz (1)

Wen-wai Yim (1)

Chaojie Zhang (1)

Ursula Hardy (1)

Sami Khairy (1)

Stephen Schneider (1)

Liqun Li (1)

Baotong Lu (1)

Newman Cheng (1)

Kenza Bouzid (1)

Andrzej Banburski-Fahey (1)

Seth Spielman (1)

Vidhisha Balachandran (1)

Matthew Vogel (1)

Darya Moldavskaya (1)

Minseon Kim (1)

Sihao Chen (1)

Agathe Balayn (1)

Lucas Caccia (1)

Nick Pangakis (1)

Jessica Young (1)

Ogbemi Ekwejunor-Etchie (1)

Reuben Tan (1)

Lingjiao Chen (1)

Zhengyan Shi (1)

Alex Dow (1)

Cassiano Becker (1)

Anant Khandelwal (1)

Wenhui Wang (1)

Zhiliang Peng (1)

Yaoyao Chang (1)

Jianwei Yu (1)

Subhro Das (1)

Waqas Zamir (1)

Wassim Hamidouche (1)

Taketomo Isazawa (1)

Renyi Qu (1)

Hannah Cha (1)

Hannah Washington (1)

Lorenzo Jaime Flores (1)

Published Date

Publication

Token-Level Serialized Output Training for Joint Streaming ASR and ST Leveraging Textual Alignments

Sara Papi, Peidong Wang, Junkun Chen, Jian Xue, Jinyu Li, Yashesh Gaur

Workshop of Automatic Speech Recognition and Understanding | December 2023

Microsoft Research Blog

Orca 2: Teaching Small Language Models How to Reason

November 20, 2023 | Ahmed Awadallah, Andres Codas, Luciano Del Corro, Hamed Khanpour, Shweti Mahajan, Arindam Mitra, Hamid Palangi, Corby Rosset, Clarisse Simoes Ribeiro, Guoqing Zheng

At Microsoft, we’re expanding AI capabilities by training small language models to achieve the kind of enhanced reasoning and comprehension typically found only in much larger models.

Orca-2 blog hero | abstract waves of data

Publication

Orca-2: Teaching Small Language Models How to Reason

Arindam Mitra, Luciano Del Corro, Shweti Mahajan, Andres Codas, Clarisse Simoes Ribeiro, Sahaj Agrawal, Xuxi Chen, Anastasia Razdaibiedina, Erik Jones, Kriti Aggarwal, Hamid Palangi, Guoqing Zheng, Corby Rosset, Hamed Khanpour, Ahmed Awadallah

November 2023

Video Access Access Project

Microsoft Research Blog

Skeleton-of-Thought: Parallel decoding speeds up and improves LLM output

November 17, 2023 | Xuefei Ning, Zinan Lin

This research was accepted by the 2024 International Conference on Learning Representations. Large language models (LLMs) such as LLaMA and OpenAI’s GPT-4 are revolutionizing technology. However, one of the common complaints about LLMs is their…

Skeleton of Thought blog hero - flow diagram

Publication

Exploring how politeness impacts the user experience of chatbots for mental health support

Robert Bowman, Orla Cooney, Joseph W. Newbold, Anja Thieme, Leigh Clark, Gavin Doherty, Benjamin Cowan

International Journal of Human-Computer Studies (IJHCS) | November 2023

Microsoft Research Blog

Research Focus: Week of November 8, 2023

November 8, 2023

Welcome to Research Focus, a series of blog posts that highlights notable publications, events, code/datasets, new hires and other milestones from across the research community at Microsoft. Generating both plausible and accurate full body avatar…

Publication

Recent Advances in End-to-End Automatic Speech Recognition (Invited Talk at ASC 2023)

Jinyu Li

| November 2023

Published by Microsoft

Publication

TextDiffuser-2: Unleashing the Power of Language Models for Text Rendering

Jingye Chen, Yupan Huang, Tengchao Lv, Lei Cui, Qifeng Chen, Furu Wei

November 2023

Tool

MEGA Multilingual Benchmarking

Official code for the paper published at EMNLP 2023 paper: Multilingual Evaluation of Generative AI (MEGA), a framework to evaluate Large Language Models (LLMs) on various multilingual benchmarks

GitHub

Microsoft Research Blog

Research Focus: Week of October 23, 2023

October 25, 2023

In this issue: Kosmos-2.5: A Multimodal Literate Model; Can vine copulas explain complex relationships of weather variables; New system accelerates the adaptive training process; Structural inequalities and relational labor in the influencer industry.

Human language technologies

Highlights