微软新专利展示音生图AI模型会议中可据演讲者话题实时更新背景图像

老牧童 • 2024-10-19 11:45 • 未分类 • 阅读 28

大家好，欢迎来到IT知识分享网。

【太平洋科技快讯】近日，微软取得了一项突破性专利，该专利技术能够将用户的实时语音输入转化为图片，为会议和讲座带来全新的视觉体验。根据专利描述，这项技术在会议或讲座场合中，能够实时捕捉音频，并通过先进的语言模型对内容进行总结，最终生成相应的AI图像。这一过程涉及三个主要环节：音频捕捉、文本处理和图像生成。

具体操作步骤如下：

捕捉音频：用户通过麦克风发言，系统实时记录并转换成文本。

处理文本：系统将文本分段，利用语言模型对每段内容进行总结。

生成图像：根据总结内容生成的提示，系统创建AI图像，并在屏幕上实时展示。

这项技术预计将主要应用于Microsoft Teams，能够根据演讲者话题的变化实时更新图像，提升视觉沟通效果。微软表示，这种图像辅助功能有助于更清晰地传达信息，尤其适合视觉学习者。

微软于2023年4月5日提交的这项专利，经过长达半年的审核，于10月获得美国商标和专利局的批准。该专利共包含20页内容，详细描述了如何将语音实时转化为图像的技术。

null

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://yundeesoft.com/91076.html

微软新专利展示音生图AI模型 会议中可据演讲者话题实时更新背景图像

相关推荐

发表回复

微软新专利展示音生图AI模型会议中可据演讲者话题实时更新背景图像