Human language technologies

Researching software and systems that bridge the linguistic divide between people and machines to make communicating with computers as natural as speaking with family and friends.

Lydia Nishimwe's MSR Africa, Nairobi seminar

Making Sentence Embeddings Robust to User-Generated Content | Video

Microsoft Research Forum | Episode 3 | Daniela Massiceti

Insights into the Challenges and Opportunities of Large Multi-Modal Models for Blind and Low Vision Users: CLIP

Project GraphRAG | LLM-Derived Knowledge Graphs

Microsoft Research Forum | Episode 3 | panel discussion

PARIKSHA: A Scalable, Democratic, Transparent Evaluation Platform for Assessing Indic Large Language Models

Current selections

Sort by: Most recent

Clear selections

Search within these results

Content Types

People

Jianfeng Gao (195)

Jinyu Li (181)

Furu Wei (108)

Chin-Yew Lin (104)

Yifan Gong (92)

Kalika Bali (71)

Michel Galley (70)

Sunayana Sitaram (55)

Sarangarajan Parthasarathy (50)

Shujie Liu (49)

Chris Quirk (44)

Lei Cui (44)

Xiaodong Liu (41)

Dan Bohus (40)

Xiaofei Wang (39)

Shuohang Wang (32)

Weizhu Chen (30)

Sudha Rao (28)

Li Dong (28)

Lijuan Wang (26)

Nan Yang (26)

Qianhui Wu (26)

Dongdong Zhang (25)

Dongmei Zhang (24)

Yang Liu (24)

Ivan Tashev (22)

Liang Wang (22)

Sujay Kumar Jauhar (20)

Shaohan Huang (19)

Eric Horvitz (18)

Yu Shi (18)

Yeyun Gong (17)

Hao Cheng (17)

Michael Xu (17)

Weijia Xu (17)

Hoifung Poon (16)

Michael Levit (16)

Hannes Schulz (16)

Ben Van Durme (16)

Yuqing Yang (16)

Jorge J. G. Leandro (16)

Ryen W. White (15)

Yao Qian (15)

Xingdi Yuan (15)

Tanuja Ganu (15)

Linjun Shou (寿林钧) (15)

Hsiao-Wuen Hon (14)

Nebojsa Jojic (14)

Shi Han (14)

Xing Xie (14)

Yan Huang (14)

Budhaditya Deb (14)

Tengchao Lv (14)

Millicent Ochieng (14)

Lars Liden (13)

Manik Varma (13)

Hanna Wallach (13)

Fangzhao Wu (12)

Advait Sarkar (12)

Xia Song (12)

Xufang Luo (12)

Robert Sim (11)

Hamed Khanpour (11)

Xiubo Geng (11)

Dongsheng Li (11)

Milad Shokouhi (10)

Yaobo Liang (10)

Shikhar Sharma (10)

Linjie Li (10)

Cha Zhang (9)

Jacki O'Neill (9)

Nick Craswell (9)

Bo-June (Paul) Hsu (9)

Qiang Huo (9)

Yi Mao (9)

Young Jin Kim (9)

Rangan Majumder (9)

Manthan Thakker (9)

Sam Thomson (9)

Amit Sharma (8)

Paul Smolensky (8)

Alessandro Sordoni (8)

Sheng Zhang (8)

Barun Patra (8)

Corby Rosset (8)

Harsh Jhamtani (8)

Adam Fourney (7)

Dinei Florencio (7)

Qingwei Lin 林庆维 (7)

Sean Rintel (7)

Guoxin Wang (7)

Tristan Naumann (7)

Robert Gmyr (7)

Danqing Huang (7)

Kevin Larson (7)

Xingxing Zhang (7)

Akiko I. Eriguchi (7)

Dasha Metropolitansky (7)

Maximiliana Behnke (7)

Scott Counts (6)

Ed Cutrell (6)

Hannes Gamper (6)

Marc-Alexandre Côté (6)

Swadheen Shukla (6)

Sheng Zhao (6)

Zinan Lin (6)

Ece Kamar (5)

Jonathan Larson (5)

Henrique S. Malvar (5)

Pallavi Choudhury (5)

Sriram Rajamani (5)

Sumit Gulwani (5)

Swami Manohar (5)

Solon Barocas (5)

Adam Atkinson (5)

Mahmoud Adada (5)

Oscar Koller (5)

Mohit Jain (5)

Longqi Yang (5)

Bahar Sarrafzadeh (5)

Kevin Lin (5)

Dongdong Chen (5)

Peidong Wang (5)

Xiaoyuan Yi (5)

Jennifer Neville (5)

Manish Gupta (4)

John Langford (4)

Navin Goyal (4)

Sumit Basu (4)

Jaime Teevan (4)

Marcin Junczys-Dowmunt (4)

Akshay Nambi (4)

Cliff Wong (4)

Sunit Sivasankaran (4)

Mohamed Ahmed (4)

Noel Codella (4)

Sara Abdali (4)

Reshmi Ghosh (4)

Patrick Xia (4)

Baolin Peng (4)

Ambrosio Blanco (3)

Anton Schwaighofer (3)

Ahmed Tawfik (3)

Darren Edge (3)

Emre Kiciman (3)

Fan Yang (3)

Jennifer Wortman Vaughan (3)

Jianlong Fu (3)

Jack W. Stokes (3)

Katja Hofmann (3)

Kate Crawford (3)

Lei Ji (3)

Lidong Zhou (3)

Mark Encarnación (3)

Nirupama Chandrasekaran (3)

Silviu Cucerzan (3)

Vishal Chowdhary (3)

Ben Zorn (3)

Anja Thieme (3)

Paul Thomas (3)

Harsha Simhadri (3)

Sean Andrist (3)

Mihaela Vorvoreanu (3)

Qi Chen (3)

Haoyu Dong (3)

Dimitra Emmanouilidou (3)

Jiang Bian (3)

Naoto Usuyama (3)

Kenichi Kumatani (3)

Mengting Wan (3)

Zeqi Lin (3)

Rui Wang (3)

Jingwen Lu (3)

Amir Kantor (3)

Jack Williams (3)

Chad Atalla (3)

Andrea Tupini (3)

Huseyin Inan (3)

Najeeb G. Abdulhamid (3)

Victor Ruehle (3)

Saravan Rajmohan (3)

Jue Zhang (3)

Menglin Xia (3)

Xuchao Zhang (3)

Yuancheng Tu (3)

Lev Tankelevitch (3)

Chen Liang (3)

Achraf Chalabi (2)

Amit Deshpande (2)

Ashley Feniello (2)

Chetan Bansal (2)

Chris White (2)

Christopher Bishop (2)

Christophe Poulain (2)

David Johnston (2)

Doug Burger (2)

Bin Li (2)

Madan Musuvathi (2)

Matthai Philipose (2)

Michel Pahud (2)

Venkat Padmanabhan (2)

Peter Lee (2)

Richard Banks (2)

Rick Rogahn (2)

Suresh Parthasarathy (2)

Yan Xia (2)

Yeye He (2)

Yue Dong (2)

Iris Shen (2)

Chinmay Singh (2)

Pat Sweeney (2)

Vibhav Vineet (2)

Bo Qiao (2)

Esha Ghosh (2)

Tobias Schnabel (2)

Pu Zhao (2)

Bei Liu (2)

P. Anandan (2)

Brent Hecht (2)

Vu Le (2)

Xenofon Foukas (2)

Juan M. Lavista Ferres (2)

Aaron L Halfaker (2)

Ida Momennejad (2)

Ashley J. Llorens (2)

Ran Jia (2)

Dean Carignan (2)

Liang Du (2)

Eyal Kolman (2)

Robert Osazuwa Ness (2)

Alex Lu (2)

Serena Hillman (2)

Jiahang Xu (2)

Chung-Ching Lin (2)

Andres Codas (2)

Rujia Wang (2)

Shweti Mahajan (2)

Ade Famoti (2)

Kavyansh Chourasia (2)

Steven Truitt (2)

Ha Trinh (2)

Joshua Bradley (2)

Yupan Huang (2)

Flora Liu (2)

Guanghui Qin (2)

Pei Zhou (2)

Ashish Sharma (2)

Philippe Laban (2)

Emily Sheng (2)

Jean Garcia-Gathright (2)

Pranjal Chitale (2)

Gaurav Verma (2)

Vineeth N Balasubramanian (2)

Sheshera Mysore (2)

Debarati Das (2)

Payod Panda (2)

Andrew Blake (1)

Andreas Bode (1)

Ajay Manchepalli (1)

A.J. Brush (1)

Akshay Krishnamurthy (1)

Alvin Chen (1)

Andrzej Pastusiak (1)

Anne Loomis Thompson (1)

Ann Paradiso (1)

Anoop Gupta (1)

Abigail Sellen (1)

Aviv Hurvitz (1)

Andrew D. Wilson (1)

Victor Bahl (1)

Baining Guo (1)

Josh Benaloh (1)

Christian Borgs (1)

Bozidar Radunovic (1)

Jonathan M. Carlson (1)

Christian Bird (1)

Cecily Morrison (1)

Arnd Christian König (1)

Chris Sienkiewicz (1)

Chong Luo (1)

Christian Paquin (1)

David Sweeney (1)

Dong Chen (1)

Gopal Srinivasa (1)

Haidong Zhang (1)

David Heckerman (1)

Íñigo Goiri (1)

Jaron Lanier (1)

Jennifer Chayes (1)

Jonathan "Peli" de Halleux (1)

Jingjing Fu (1)

John Tang (1)

Rui Ding (1)

Kori Inkpen (1)

Laurent Bussard (1)

Lev Nachmanson (1)

Lily Sun (1)

Melissa Chase (1)

Michel Naim Gerguis (1)

Martin Grayson (1)

Neel Joshi (1)

Neeraj Kayal (1)

Nikunj Raghuvanshi (1)

Nikhil Swamy (1)

Peng Cheng (1)

Piali Choudhury (1)

Ravishankar Krishnaswamy (1)

Ramachandran Ramjee (1)

Ranveer Chandra (1)

Rick Rashid (1)

Ricardo Bianchini (1)

Santiago Zanella-Béguelin (1)

Sasa Junuzovic (1)

Shamsi Iqbal (1)

Shuo Chen (1)

Shuvendu Lahiri (1)

Siân Lindley (1)

Siddhartha Sen (1)

Sarah Bird (1)

Srinath Setty (1)

Suman Nath (1)

Surajit Chaudhuri (1)

Suresh Thummalapenta (1)

Tarleton Gillespie (1)

Xin Ma (1)

Yang Liu (1)

Sergey Yekhanin (1)

Yuan-Jyue Chen (1)

Zhitao Hou (1)

Shital Shah (1)

Bichlien Nguyen (1)

Ramakrishna Bairi (1)

Ankit Garg (1)

Li Zhao (1)

Arun Iyer (1)

Camilla Longden (1)

Darrin Eide (1)

Bryan Tower (1)

Qi Dai (1)

Jacob Alber (1)

Rahee Ghosh Peshawaria (1)

Nagarajan Natarajan (1)

Raluca Stevenson (1)

Sitaram Lanka (1)

Nipun Kwatra (1)

Sebastian Braun (1)

Sonu Mehta (1)

Yun Wang (1)

Qianxi Zhang (1)

Xiaowu Hu (1)

Zhirong Wu (1)

Zhixiong Niu (1)

Dave Bignell (1)

Eduardo Salinas (1)

Stephanie Hyland (1)

Jianxun Lian (1)

Carmen Badea (1)

Denae Ford (1)

Lukas Wutschitz (1)

Radames Cruz Moreno (1)

Ran Gilad-Bachrach (1)

Nathan Myhrvold (1)

Bamdev Mishra (1)

Kieran McDonald (1)

Danny Simmons (1)

Shruthi Bannur (1)

Carolyn Buractaon (1)

Yu Kang (1)

Arjun Radhakrishna (1)

Yiwen Zhu (1)

Ammar Ahmad Awan (1)

Vishak Gopal (1)

Rohit Pillai (1)

Daniel Coelho de Castro (1)

Sangeetha Shekar (1)

Felipe Oviedo (1)

Anna Pavlenko (1)

Joyce Cahoon (1)

Brian Kroth (1)

Jidong Long (龙继东) (1)

Alec Berntson (1)

Kunho Kim (1)

Rui Wang (1)

Stojan Trajanovski (1)

Samuel Chege Maina (1)

Xiyang Dai (1)

Esha Choukse (1)

Daniel Madrigal (1)

Mirian Hipolito Garcia (1)

Jason (Zengzhong) Li (1)

Ross Cutler (1)

Jesús Camacho-Rodríguez (1)

Sara Malvar (1)

Leonardo Nunes (1)

Robin Abraham (1)

Sameer Segal (1)

Jake Smith (1)

Jayashree Mohan (1)

Daniel Jones (1)

Maximilian Ilse (1)

Tommy Guy (1)

Yashoteja Prabhu (1)

Arnaud Flutre (1)

A J (HE/HIM) (1)

Chenglong Wang (1)

Michal Sroka (1)

Alejandro Gutierrez Munoz (1)

Luna K. Qiu (1)

Allie Giddings (1)

Jeevana Priya Inala (1)

Yansen Wang (1)

Darren Tanner (1)

Harsha Nori (1)

Fernando Pérez-García (1)

Krishna Doss Mohan (1)

Harkirat Behl (1)

Xiaoyu Liu (1)

Harshita Sharma (1)

James Devine (1)

Caihua Shan (1)

Yuge Zhang (1)

Xinyang Jiang (1)

Xiao Liu (1)

Morris Sharp (1)

Bonnie Kruft (1)

Jing Yao (1)

Chris Parnin (1)

Judith Amores (1)

Si Qin (1)

Tara Safavi (1)

Nan Chen (1)

Mukul Singh (1)

Chandan Singh (1)

Hosein Hasanbeig (1)

Bruno Silva (1)

Dan Vann (1)

Dongqi Han (1)

Yifei Shen (1)

Matheus Pereira (1)

Saksham Singhal (1)

Sergio Valcarcel Macua (1)

Christian Poelitz (1)

Wen-wai Yim (1)

Chaojie Zhang (1)

Ursula Hardy (1)

Sami Khairy (1)

Stephen Schneider (1)

Liqun Li (1)

Baotong Lu (1)

Newman Cheng (1)

Kenza Bouzid (1)

Andrzej Banburski-Fahey (1)

Seth Spielman (1)

Vidhisha Balachandran (1)

Matthew Vogel (1)

Darya Moldavskaya (1)

Minseon Kim (1)

Sihao Chen (1)

Agathe Balayn (1)

Lucas Caccia (1)

Nick Pangakis (1)

Jessica Young (1)

Ogbemi Ekwejunor-Etchie (1)

Reuben Tan (1)

Lingjiao Chen (1)

Zhengyan Shi (1)

Alex Dow (1)

Cassiano Becker (1)

Anant Khandelwal (1)

Wenhui Wang (1)

Zhiliang Peng (1)

Yaoyao Chang (1)

Jianwei Yu (1)

Subhro Das (1)

Waqas Zamir (1)

Wassim Hamidouche (1)

Taketomo Isazawa (1)

Renyi Qu (1)

Hannah Cha (1)

Hannah Washington (1)

Lorenzo Jaime Flores (1)

Published Date

Video

Making Sentence Embeddings Robust to User-Generated Content

June 4, 2024 | Lydia Nishimwe

This seminar was hosted by Microsoft Research Africa, Nairobi together with the Microsoft AI for Good team in May 2024. User-generated content (UGC), e.g. social media posts written in “Internet language”, presents a lot of…

01:02:50

Video

Insights into the Challenges and Opportunities of Large Multi-Modal Models for Blind and Low Vision Users: CLIP

June 4, 2024 | Daniela Massiceti

Daniela Massiceti delves into the transformative potential of multimodal models such as CLIP for assistive technologies. Specifically focusing on the blind/low-vision community, the talk explores the current distance from realizing this potential and the advancements…

06:41

Video

Panel: Generative AI for Global Impact: Challenges and Opportunities

June 4, 2024 | Jacki O'Neill, Tanuja Ganu, Sunayana Sitaram, Daniela Massiceti

Microsoft researchers discuss the challenges and opportunities of making AI more inclusive and impactful for everyone—from data that represents a broader range of communities and cultures to novel use cases for AI that are globally…

a person standing in front of a mirror posing for the camera

31:28

Tool

DOSA

A dataset of social artifacts from different Indian geographical subcultures. This repo hosts the code to run experiments on the DOSA dataset.

GitHub

Publication

Mitigate Position Bias in Large Language Models via Scaling a Single Dimension

Yijiong Yu, Huiqiang Jiang, Xufang Luo, Qianhui Wu, Chin-Yew Lin, Dongsheng Li, Yuqing Yang, Yongfeng Huang, Lili Qiu

June 2024

Publication

Language Models can be Deductive Solvers

Jiazhan Feng, Ruochen Xu, Junheng Hao, Hiteshi Sharma, Yelong Shen, Dongyan Zhao, Weizhu Chen

NAACL 2024 | June 2024

Publication

“One-Size-Fits-All”? Examining Expectations around What Constitute “Fair” or “Good” NLG System Behaviors

Li Lucy, Su Lin Blodgett, Milad Shokouhi, Hanna Wallach, Alexandra Olteanu

NAACL 2024 | June 2024

Publication

The Perspectivist Paradigm Shift: Assumptions and Challenges of Capturing Human Labels

Eve Fleisig, Su Lin Blodgett, Dan Klein, Zeerak Talat

NAACL 2024 | June 2024

Microsoft Research Blog

Research Focus: Week of May 27, 2024

May 29, 2024 | Tarleton Gillespie, Sami Khairy, Vishak Gopal, Francis Y. Yan, Zhixiong Niu, Ross Cutler, Sudha Rao, Weijia Xu, Chris Brockett, Nebojsa Jojic, Michael Xu, Jorge Leandro, Bill Dolan, Seth Spielman, Darren Edge, Ha Trinh, Joshua Bradley, Alex Chao, Apurva Mody, Steven Truitt, Jonathan Larson

How can generative AI tools represent less common identities and narratives; Can LLMs help players participate in game narratives; Using LLMs to improve geospatial demographic data; A Graph RAG Approach to Query-Focused Summarization; and more.

Tool

MunTTS: A Text-to-Speech System for Mundari

We present MunTTS, an end-to-end text-to-speech (TTS) system specifically for Mundari, a low-resource Indian language of the Austo-Asiatic family. Our work addresses the gap in linguistic technology for underrepresented languages by collecting and processing data to…

GitHub Project

Human language technologies

Highlights